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0 مشروءع علم بيانات تم حلها وشرحها باستخدام بایئون 


ترجمه واعداد: 


د. علا: طعدمة 


۰ 7۲ لكف ف‎ o 
مقدمة المؤلف‎ 

تعد البيانات اليوم أداة ووقودًا للشركات لاكتساب رؤى مهمة وتحسين أدائها. سيطر علم 
البيانات على كل صناعة تقريباني العالم. لا توجد صناعةفي العالم اليوم لا تستخدم البيانات. 

بصفتك مبتدتانی علم البيانات» من الصعب فهم جميع المفاهيم التي تتعلمها دون تنفيذهاني 
مجموعة بيانات. سيساعدك العمل‌في مشاريع علم البيانات ودراسات الحالة على تحسين 
مهاراتك‌ني علم البيانات. إذاكنت تكافح من أجل ابتكار أفكار لمشروع علم البيانات وكيفية بدء 
مشروع علم البيانات وانهائه. فهذا الكتاب مناسب لك.ني هذه الكتاب. سوف يأخذك المؤلف 
من خلال قائمة مشاريع علم البيانات باستخدام بايثون والتي ستساعدك على تعلم وتنفيذ جميع 
مفاهیم علم البيانات باستخدام لغة برمجة بايثون. 

لقد حاولت قدر المستطاع ان اترجم المشاريع الأكثر طرحآني مجال علم البيانات مع الشرح 
المناسب والكافي. ومع هذا يبقى عملاً بشرياً يحتمل النقص. فاذا كان لديك أي ملاحظات حول 
هذا الکتاب. فلا تتردد بمراسلتنا عبر بريدنا الالكتروني 10.-21012)0(30.601) .2122 . 

نأمل ان يساعد هذا الکتاب كل من يريد ان يدخلني مجالات علم البیانات ومساعدة القاری 
العربي على تعلم هذا المجال. اسأل الله التوفيقفي هذا العمل لأثراء المحتوی العربي الذي یفتقر 
أشد الافتقار إلى محتوی جيد ورصينفي مجال علم البیانات. ونرجو لك الاستمتاع مع الکتاب 


د. علاء طعيمة 
كلية علوم الحاسوب وتكذولوجيا المعلومات 
جامعة القادسية 


العراق 


المحتويات 


12 ...Weather Forecasting using Python التنبق بالطقس باستخدام بایئون‎ )1 


التنبق بالطقس 0000 ا ا 1# 
تحلیل بیانات الطقس باستخدام بایئون و 
تحلیل تغير درجة الحرارة رها دنه ره مه ما هم LS ies SROs SRS‏ 
التنبؤ بالطقس باستخدام بايثون 16.000 
الملخص IZ meses eos eS Ks Se‏ 
2) تحليل وقت الشاشة باستخدام بايثون Screen Time Analysis using Python‏ 
LO NSS OSSD NESSES SESE aA RSA Sa SS‏ 
تحليل وقت الساسة مه SVS OREO OAS‏ 18 
تحليل وقت الشاشة باستخدام بايثون 066بب7بب-1ذ011 ا O.‏ 
الملخص ممه وه وي ع ول للم ف بیس لطاع لم وه این سوه فطاع ل فلم الل ا للا كط ع ا چم 21 

3 تحليل سوق الأسهم باستخدام بايثون Stock Market Analysis using Python‏ 
اا 21000000000 
تحليل سوق الأسهم باستخدام بايثون D2 CD‏ 
الملخص موه سمه قن عم همه هه هک هه شش قل زو 20 

4) التنبق بالا عمال التجارية باستخدام بایئون Business Forecasting using Python‏ 
ا ةو نو ف فاخ تسو موتو نف قدو 2 
لماذا يحتاج العمل التجاري إلى التنبق بالا عمال التجارية؟ AT‏ 
التنبق بالا عمال التجارية باستخدام بايثون 27 
الملخص اع renee‏ ا أ مک Lira‏ 

5) نظام توصية الأخبار باستخدام بايثون News Recommendation System using‏ 
O PO Python‏ اه جتنو طخو جاخ ده هی 32 
كيف يعمل نظام توصيات الأخبار؟ ID O RS‏ 
نظام توصية الأخبار باستخدام بايثون ela‏ 321 
الملخص ans a Raa‏ ال اا ل حا اط اع 35 

iPhone Sales Analysis using تحليل مبيعات 1۳0006 باستخدام بایئون‎ )6 
IO criceticola ies ولع مخ دای قال‎ ak Python 


الملخص QO esses se a as a a‏ 
7] تحليل مبيعات ٤۲ھkم1ا۴‏ باستخدام بايثون Flipkart Sale Analysis using‏ 
Python‏ جف سوه بقن عاق شع وق و ا اع ل هه 00015 خاي عطقنا فاطو اونا ADIR‏ 092 
تحلیل مبیعات ۴۱۱0۱۵۲۲ as casa‏ وهی بو هو هتم من AZ‏ 
تحليل مبيعات ۵۲٤‏ )ما۴ باستخدام بايثون A2 esol‏ 
التكلفة اليومية لبيع الهواتف الذكية إلى ۴۱:0۱۵۳۲ ...45 
الملخص asa‏ الام عع السو و اه ممصم جو اا لامر كا اام هو و 46 
8) تحليل أسعار الماس باستخدام بايثون Diamond Price Analysis using‏ 
aa Python‏ خی الوه ماک مده عدت ال هم بل حقو یی البو وا بش و 917 
تحليل سعر الماس 27 
تحليل أسعار الماس باستخدام بايثون AT‏ 
التنبق بسعر الماس SD O O O O E O OS‏ 
الملخص ا 52 
9 نظام توصيات :۱۶0/1 باستخدام بایئون Netflix Recommendation System‏ 
as using Python‏ عع و الوق و و وقد لمعم وام مو م هه موه هو 53 
كيفية عمل نظام توصیات ۱۱۵۲۲۱۱ as‏ 00000 
نظام توصیات :۱۱6۲۲۱ باستخدام بایئون و ون یر 35 
الملخص ذذذخذذخخأ5 6 و 
0] التنبة بترافيك موقع ويب باستخدام بایئون Website Traffic Forecasting‏ 
ê using Python‏ معدم لاساو اوفط امأ ل aS O‏ وي 519 
التنبؤ بترافيك موقع ويب باستخدام بايثون BE‏ 
الملخص ودام لامع واه واوا سان وا ER RSE asa‏ موه وهی 63 
1) نظام توصية المطاعم باستخدام بایئون Restaurant Recommendation‏ 
RoE System using Python‏ ا 01 
نظام توصية المطاعم باستخدام بايثون GA a‏ 
الملخص SSS‏ ا و وال مور 66 
2) تحليل أداء اللاعب Virat Kohli‏ باستخدام بايثون Virat Kohli Performance‏ 
Analysis using Python‏ عا SESS ERAS‏ نو تاه RSS SRO‏ ی OTs‏ 


تحلیل آداء ۱۵۱ ۷۱۳۵۶ (دراسة حالة) هه اس سل سیسوس 87 


3 نظام توصية الكتب باستخدام بایئون Book Recommendation System‏ 


[7 تا بطق ةا لان لال‎ AAS using Python 
ZO secere نظام توصية الكتب باستخدام بايثون‎ 
78 1 الملخص مع لجع او لفطك لان فق لع لالط و ع یاه 11641014414 14 فطع الام‎ 

4] تحليل بيانات الساعات الذكية باستخدام بايثون Smartwatch Data Analysis‏ 

Tnsen لتق اول الالال‎ aE Sees ea using Python 
Tess تحليل بيانات الساعة الذكية باستخدام بایئون‎ 
32 SS SERS Sia تحليل بيانات الساعة الذكية‎ 
86 sesa issa ae قرول لاق هس هو‎ Raa aa ê as الملخص‎ 

5 تحليل 2022 ,121 باستخدام بایئون ...IPL 2022 Analysis using Python‏ 87 
تحليل 2022 ۱۴۱ باستخدام بايثون a A‏ 
الملخص e‏ هر و هه وم مه هروه و مرو لق RR‏ هو وه وه اه هتم ی 92 

6 تحلیل تأثیرات 00710-19) باستخدام بایئون Covid-19 Impacts Analysis‏ 

93 و ا ا و‎ using Python 
93 تحلیل آثار 0۷۱0-19 (دراسة حالة)‎ 
931 تحلیل تأثیرات 60۷0-19 باستخدام بایئون وک و مس شش موی‎ 
94 .: واه مود وود ویو‎ aaa تحضير البیانات ور‎ 
IS asas ©01/10-19 تحليل انتشار‎ 
101: تحليل تأثيرات 60110-19© على الاقتصاد ل ال و ا‎ 
1111111 10000000 الملخص‎ 

6) تحليل مدى الوصول إلى 1251251812 باستخدام بايثون Instagram Reach‏ 

1005 هه هک‎ SS هه‎ SSS لط‎ Analysis using Python 
105 lo RS aa ۱۱5۲۵82۲۵۳۱ تحليل مدق الوصول إلى‎ 
105:4 تحليل مدى الوصول إلى ۱۳5۲۵82۲۵۳۱ باستخدام بایئون لعو ممت ا عه م‎ 

تحليل مدق وصول ۱۱5۲۵82۲۵۳ ل که ده موه لوطع ف و 107 
تحلیل المحتوی هه که واه مه اه وهی عم و الك TOISAS‏ 


نموذج توقع الوصول الی۱۱۹۲۵82۲۵۳۱ ا و ل ما ی مره ا ا 114 
الملخص 100000000001010 ی ی MS‏ 
7 تحلیل مشاعر مراجعات 11006۲ باستخدام بایئون Reviews‏ 11۳06۲ 
Sentiment Analysis using Python‏ ا ی 03 ۱11 
تحليل مشاعر مراجعات :11506 باستخدام بايثون O.‏ 
الملخص sea‏ شوه قلع ا ا ال ا لع ا ع تس نم 120 
8) تحليل المشاعر لمراجعات 111101 باستخدام بايثون Reviews‏ 111101 
LALES Ec Sentiment Analysis using Python‏ 
تحليل المشاعر لمراجعات ۲:۲0 باستخدام بايثون DLs‏ 
الملخص قي قط قوقع قل هأ فاطو عط اال مه هر دج وک اعم مج مزه لمق اماه مهس 125 
9 تحليل مشاعر حرب أوكرانيا وروسيا على تويتر باستخدام بايثون 7۵6 
Russia War Twitter Sentiment Analysis using Python‏ له اه اه :120 
تحليل معنويات حرب أوكرانيا وروسيا على تويتر باستخدام بايثون ......... 126 
الملخص عمد اك مع مه قد هک لما TILA‏ 
0 تحليل مشاعر مراجعات ٤۲ھkمFIi‏ باستخدام بايثون Flipkart Reviews‏ 
Sentiment Analysis using Python‏ ا ااا 132 
تحليل مشاعر مراجعات ۵۲۲ )ما۴ باستخدام بایئون وان ل ۱332 
تحلیل المشاعر لمراجعات۲۱۱۵۱۷۵۲۲ 011 یش 137 
الملخص DS O O‏ 
1 تحليل المشاعر تجاه لقاح فايزر بالستخدام بایئون Pfizer Vaccine Sentiment‏ 
SSSR sak Analysis using Python‏ ونانف لا ل مر و هو 0 3 | 
تحليل المشاعر تجاه لقاح فايزر باستخدام بايثون TOs ad‏ 
الملخص و حم وا و الم ال لع خسو وجي مكلو ملك او و الال ال نوا لوأ و وج وق مشو DAO‏ 
2 تحليل المشاعر تجاه متحور 00121102 باستخدام بایئون 00008 
Alcester Sentiment Analysis using Python‏ 
تحليل المشاعر لمتحور 01016101 باستخدام بايثون es‏ 1001000 
تحليل المشاعر لمتحور 00۱6۲۵0 DAZ O O.‏ 


Water Quality Analysis using python تحليل جودة المياه باستخدام بایئون‎ )3 


LAS aioe ره مر لول ا و رش عم ا و ا‎ ESSE Rn 
145 تحلیل جودة المیاه لاتحي ره اتا رمام مه هر مره امه وا وله مها ورام ام هام ون ما ون‎ 
125 رتش تسب‎ se تحلیل جودة المیاه باستخدام لغة بایئون و سس‎ 
1000000 00000 نموذج التنبق بجودة المياه باستخدام لغة بايثون ز زد‎ 
DD الملخص‎ 

24( تحليل المشاعر على Twitter‏ باستخدام بايثون Twitter Sentiment Analysis‏ 
using Python‏ هی LSI aseno RGSS‏ 
تحلیل المشاعر على Twitter‏ 7 315 
تحليل المشاعر على ۲۷/:۲۲6۲ باستخدام بايثون DSc‏ 
الملخص ا ا ا[ 0000000011 
5 تحليل مشاعر لعبة الحبار باستخدام بایئون Squid Game Sentiment‏ 
Analysis using Python‏ ا ا و ا ا O SEE‏ ا LS SD‏ 
تحلیل المشاعر لعبة الحبار باستخدام بایئون ی 
الملخص 0 E‏ 0 .1602 
6 تحليل تصنيف الفیلم باستخدام بایئون Movie Rating Analysis using‏ 
Python‏ ااا OL SSeS aaa LASS Dea‏ 
تحليل تصنيف الفیلم باستخدام بايثون .161 
الملخص ll‏ 1[ 101000 
7) تحليل الملیاردیرات مع بایئون Billionaires Analysis with Python‏ .....165 
تحليل المليارديرات مع بايثون 00 0 LOS‏ 
الملخص n‏ [ذ[ز[ز[ز ز ز [ [ 1 ۱ 
8 تحليل البطالة مع بايثون Unemployment Analysis with Python‏ ......170 
تحليل البطالة مع بايثون 10 [ز[ؤ[ [ز[ز[ [ز[ز [ ز [ 100 
تحليل معدل البطالة: تصوير البيانات ؤ0 زؤز ز[ز[ز ز ز ز ۱1 
الملخص 1500000000 15151ز1[ز[ز3ز[ز[زؤ[ؤزؤز[ز[ [ [ؤ[ [ؤ[ؤ[زؤزؤز[ز ز ز 1 را 
9) تحليل دردشة WhatsApp‏ مع بایئون WhatsApp Chat Analysis with‏ 
Python‏ ره نه عام عه أل aS‏ ماه دام جه ف گرم مه مرگ لالع ل هر TENGEN ORS‏ 


الملخص ی O‏ 
0) تحليل المشاعر في دردشة ۷۲۷۳۵/۹۸۲ باستخدام بايثون WhatsApp Chat‏ 
Sentiment Analysis using Python‏ ماع و که السو و ل م 181 
تحلیل المشاعر دردشة WhatsApp‏ هه هو 1000 
تحلیل مشاعر الدردشة عبر ۷۷۳۵۲5۸۵۵0 باستخدام بایئون وه زیت 192 
الملخص SS SS‏ 1 
2 تحليل لقاحات 00910-19) باستخدام بايثون Covid-19 Vaccines Analysis‏ 
with Python‏ ی سم سا دا در او ا 185 
تحليل لقاحات 60۷0-19 ا ES‏ 
تحليل لقاحات 60۷0-19 باستخدام بايثون < 18S. a‏ 
الملخص 2 
3 التنبؤ بمبيعات ألعاب الفيديو باستخدام لغة بايثون Video Game Sales‏ 
Prediction with Python‏ و و و لقره طم م مه موم و 190 
نموذج التنبؤ بمبیعات آلعاب الفیدیو باستخدام بایئون شیک وب 190 
نموذج التنبؤ بمبيعات ألعاب الفيديو التدريبية ...192 
الملخص ره 
4 تحلیل رحلات ۲06۲ باستخدام بایئون Uber Trips Analysis using Python‏ 
حو طق اسه ع رم مه لأ فق حم و كشو ورج ی اه وی موجه جما 4 ی موه افق و 193 
تحليل رحلات ۱۱06۲ أ سي فح لط ليق ااه ما لوا هه ود مه تم دوس 193 
تحليل رحلات :عطنا باستخدام بايثون و ام ا ا و ل اق وشن ون 193 
الملخص LOO SS o‏ 
5 تحليل بحث ع1ع008© باستخدام بایئون Google Search Analysis with‏ 
Python‏ رد هی O RR‏ ۱95 
تحليل بحث 6ا6008 باستخدام بايثون ای هه وو م ا مو 198 
الملخص ب “23*31 
6) تحليل الموازنة المالية مع بايثون Financial Budget Analysis with Python‏ 
انعو تسسات ستول SE‏ مومه موقو عه وه ماه ات Sas‏ و دس اب و قم 201 
ماهي الموازنة المالية؟ 0 1 OL‏ 


تحليل الموازنة المالية مع بايثون 20 


7 تحليل أفضل خدمات البث باستخدام بايثون Best Streaming Service‏ 


205 SASSOON وه‎ ESS Analysis with Python 
20S O تحليل أفضل خدمات البث ات یت‎ 
205 eosin تحليل أفضل خدمات البث باستخدام بايثون‎ 
206 2121 1441:42:14 تحضير البيانات عمجو فيج قله كو هه‎ 
207 ns الخطوة النهائية: العثور على أفضل خدمة بث‎ 
200 الملخص‎ 
Birth Rate Analysis with python تحليل معدل المواليد باستخدام بايثون‎ )8 
210 ون ملم ع لاما ملعا ماه قا جا ع قل لق رها ار او هه مه اميل افو ا ا ل ل رار و لاك ا كا ا میهد و‎ 
DI sss المزيد من استكشاف البيانات‎ 
۸۸420۸ تحليل المشاعر في تقييمات منتجات ۸2200 باستخدام بايثون‎ 9 
201001 01 000 Product Reviews Sentiment Analysis with Python 
213 ........... تحليل المشاعر في تقييمات منتجات 803201 باستخدام بايثون‎ 
AAs aa 113201 تحليل المشاعر لمراجعات منتجات‎ 
216 sss الملخص‎ 
Hotel Reviews Sentiment تحليل مشاعر تقييمات الفندق مع بایئون‎ 0 
217 E E O Analysis with Python 
2117 تحليل مشاعر تقييمات الفندق مع بايثون ومن الع اح ال ل له ا‎ 
الملخص ددددد0 ا ا هه‎ 
Google Play Store تحليل المشاعر في متجر :2819 6008216 باستخدام بایئون‎ 1 
7 Sentiment Analysis using Python 
221 EE 600816 ۳۱۵۷ تحليل المشاعر في متجر‎ 
220 ceases تحليل المشاعر في متجر ۴۱۵۷ 6ا6008 باستخدام بايثون‎ 
1 001 الملخص‎ 
Amazon ۸۱۵۵ تحليل مشاعر مراجعات ۸۱6۵ 41222011 باستخدام بایئون‎ 2 
2 2 هه ی مها و‎ Reviews Sentiment Analysis using Python 
22 5 تحلیل مشاعر مراجعات ۸۱۰۲۵ 81032010 باستخدام بایئون ی ی‎ 
225 و عم مر‎ Amazon ۸۵۱۶۲۵ تحلیل مشاعر مراجعات‎ 


3) نظام توصية 4227202 باستخدام بایئون Amazon Recommendation‏ 


221 فاط كل ةوك‎ SRSA ESER ESSERE تتفم‎ System using Python 
A2 essa soso ۸۳۰۱20۳۱ نظام توصية‎ 
22 7 essa نظام توصية 48113200 باستخدام بايثون ل فخ‎ 
229 


التنبؤ بالطقس باستخدام بايثون 12 


Weather التنبة بالطقس باستخدام بایلون‎ 1 
Forecasting using Python 

في علم البيانات (ءء١ع1ءS‏ 10262).: التنبؤ بالطقس هو تطبيق للتنيؤ بالسلاسل الزمنية ( 11106 
8 مو5011) حيث نستخدم بيانات وخوارزميات السلاسل الزمنية لعمل تنبؤات 
لوقت معين. إذا كنت تريد معرفة كيفية التنبؤ بالطقس باستخدام مهاراتكفي علم البیانات. فهذه 
المقالة مناسبة لك.في هذه المقالة» سوف آخذك خلال مهمة التنبؤ بالطقس ( 1762661 


(forecasting‏ باستخدام بايثون. 


التنبؤ بالطة 
التنبؤ بالطقس هو مهمة التنبؤ بأحوال الطقس لموقع ووقت معين. باستخدام بيانات وخوارزميات 
الطقس. من الممكن التنبؤ بأحوال الطقس لعدد 2 من الأيام القادمة. 


للتنبؤ بالطقس باستخدام بايثون. نحتاج إلى مجموعة بيانات تحتوي على بيانات الطقس 
التاريخية بناءً على موقع معين. لقد وجدت مجموعة بيانات على 16216 استنادًا إلى بيانات 
الطقس اليوميةفي نيودلهي. یمکننا استخدام مجموعة البيانات هذه لمهمة التنبؤ بالطقس. يمكنك 
تنزیل مجموعة البیانات من هنا. 


في القسم آدناه ستتعلم كيف یمکننا تحلیل الطقس والتنبو به باستخدام بایشون. 


تحلیل بیانات الطقس باستخدام بایئون 
الآن لنبداً هذه المهمة عن طریق استیراد مکتبات بايثون ومجموعة البیانات التي نحتاجها: 


import pandas as pd 

311۳00 تكن‎ 25 MP 

1۳001 1۵101011110۰۳۷۵1 وه‎ 1 
import seaborn as 585 

4S P<‏ ۵2016۵98 .۰ 0101۷ نهلك 


0212 = 0.1620 ترفك‎ ) ۲۲۵1 111۱۲۵1۳101 1102 ۲6 1121 0۰ E SME) 
print (data.head () ) 


date meantemp humidity wind_speed meanpressure 
2013-01-01 10.000000 0 9.00090 1015.666667 
2013-01-2 7.400000 92.000000 2.980000 1017 . 800000 
2013-01-3 7. 166667 ۰ 0 4.3 1018.666667 
2013-01-4 8.666667 71.333333 1.3 1017.166667 
2013-01-5 6.000000 3 3.700000 1016. . 060 


© دا یم س هھ 


دعونا نلقى نظرة على الإحصائيات الوصفية لهذه البيانات قبل المضى قدمًا: 


print (data.describe () ) 


علم البيانات: عن طريق الامثلة 


meantemp humidity wind_speed meanpressure 
count 1462.000000 1462.000000 1462.000000 1462 . 6 
mean 25,1 60.771702 6.802209 1011.104548 
std 7.348103 16.769652 4.561602 180.231668 
min 6.000000 13.428571 6. 066 - 7 
25% 18.857143 50.375000 3.475000 1001.580357 
50% 27.714286 62.625000 6.221667 1008.563492 
75% 31. 4 72.218750 9.235 1014.944901 
max 38.714286 100.000000 42 . 060 7679.333333 


دعنا الآن نلقي نظرة على المعلومات المتعلقة بجميع الأعمدةفي مجموعة البيانات: 


11 E (OES ۰.1۳8۴0 )(( 


<class 'pandas.core.frame.DataFrame' > 
RangeIndex: 1462 entries, © to 1461 
Data columns (total 5 columns): 


# Column ۱۱۵۴-۱۱11 6 
@ date 1462 non-null object 
1 meantemp 1462 non-null 4 
2 humidity 1462 non-null float64 
3 wind_speed 1462 non-null 4 
4  meanpressure 1462 non-null +4 


dtypes: float64(4), object(1) 


memory usage: 57.2+ KB 


لا يحتوي عمود التاريخ (011:710» 0266) في مجموعة البيانات هذه على نوع بيانات التاريخ 
والوقت. سنقوم بتغييره عند الحاجة. دعونا نلقي نظرة على متوسط درجة الحرارة ( 1116211 
6 te)ض‏ دلهي على مر السنين: 


figure = .عام‎ 13106 (data, x="date", 

y="meantemp", 

title='Mean Temperature in Delhi Over the 
Years') 


figure. show )( 


Mean Temperature in Delhi Over the Years 
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اتنب بالطقس باستخدام باون 


الآن دعونا نلقي نظرة على الرطوبة (1211110167)في دلهي على مر السنين: 
(data, x="date ,"‏ 1106 .عام = figure‏ 
VE UMS EY‏ 


title='Humidity in Delhi Over the Years('" 
figure. show )( 


Humidity in Delhi Over the Years 
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الآن دعونا نلقي نظرة على سرعة الرياح (0660: 51120 )في دلهي على مر السنين: 


figure = .عام‎ 1106 (data, x="date ," 
NEN SEE تس‎ 
title='Wind Speed in Delhi Over the Years ) ' 


figure. show) 


Wind Speed in Delhi Over the Years 


wind_speed 


Jan 2013 اناد‎ 3 Jan 2014 Jul 2014 Jan 2015 Jul 2015 Jan 2016 Jul2016 Jan 2017 
date 


حتى عام 2015. كانت سرعة الرياح أعلى خلال الرياح الموسمية (أغسطس وسبتمبر) وتراجع 
الرياح الموسمية (دیسمیر ويناير). بعل عام ۰2015 لم تكن هناك حالات شاذةفي سرعة الرياح 
خلال الرياح الموسمية. دعنا الآن نلقي نظرة على العلاقة بين درجة الحرارة والرطوبة: 


E1 ,اوه < لاله ۳1 ات 09) ها 569 ۳۶۰ هلان‎ XI 0 را‎ 
y="meantemp", size="meantemp ۲ 
trendline="ols ," 
title = "Relationship Between Temperature 
EO ۲۳4 111-7۷7 ۳ 
figure. show )( 


علم البيانات: عن طريق الامثلة 


اس 
ار 


Relationship Between Temperature and Humidity 
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هناك علاقة سلبية بين درجة الحرارة والرطوبةفی دلهي. وهذا يعني أن ارتفاع درجة الحرارة يؤدي 
إلى انخفاض الرطوبة وانخفاض درجة الحرارة يؤدي إلى ارتفاع نسبة الرطوبة. 


تحليل تغير درجة الحرارة 

الآن دعونا نحلل التغيرفي درجة الحرارةفي دلهي على مر السنین. بالنسبة لهذه المهمة. سأقوم أولاً 
بتحويل نوع بيانات عمود التاريخ إلى التاريخ والوقت. ثم سأضيف عمودين جديدين في مجموعة 
البيانات لقيم السنة والشهر. 


إليك كيفية تغییر نوع البيانات واستخراج بيانات السنة والشهر من عمود التاريخ: 


0212 ] ۰۵۲6۳۲ | < 00۰0 021۳66116 (da eal dae ll, 26222025 > CH cI 
50 ( 

data ] ۲۷۵۵۲۲ [ = data['date']|.dt.year 

0212 ] ۲۳۵۳۴۲۳۳۲ 3 dalal ۲۹۵۲۵۳۲ [ ۰01 MONE 

print (data.head )(( 


date meantemp humidity wind_speed meanpressure year month 
6 2013-01-01 10.000000 08 9.00090 1615۰666667 3 1 
1 2013-01-2 7.400000 ۰0 2.980000 1017.800000 2013 
2 2013-01-3 7. 166667 ۰ 0 4.63333 1018.666667 2013 
3 2013-01-04 8.666667 71.333 1.233333 1017.166667 3 
4 2013-01-5 6.000000 86.833333 3.700000 1016.500000 2013 


الآن دعونا نلقي نظرة على تغير درجة الحرارةفي دلهي على مر السنين: 


۱11 . 51-۷16 ۰ 1:56 ('fivethirtyeight') 

((10 , 15) حه2 ۶1051) هیال ۴1 . 11 

plt.title ("Temperature Change in Delhi Over the Years") 
sns.lineplot (data = data, x='month', y='meantemp', hue='year'") 
1011 . 5۳017 )( 


در در بر در 


Temperature Change in Delhi Over the Years 
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۳ 
0 


meantemp 
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بو 


month 


على الرغم من أن عام 2017 لم يكن الأكثر سخونةني الصیف. يمكننا أن نرى ارتفاعافي متوسط 
درجة حرارة دلهي كل عام. 


التنبق بالطقس باستخدام بايثون 
الآن دعنا ننتقل إلى مهمة التنبؤ بالطقس. سأستخدم نموذج )Facebook prophet)‏ لهذه 
المهمة. يعد نموذج 070066 ۳۵6۵001 أحد أفضل التقنيات للتنبؤ بالسلاسل الزمنية. إذا لم 
تستخدم هذا النموذج من قبل. فيمكنك تثبيته على نظامك باستخدام الأمر المذكور أدناهفي موجه 
الأوامر أو التيرمينال: 

pip install prophet 
يقبل نموذج 070066 بيانات الوقت المسماة "45" والتسميات على أنها ۷7". فلنحول البيانات‎ 
إلى هذا التنسيق:‎ 


SS ) 026 2 Oy,‏ لال )2626 7 aS dala > Gaeta‏ 2 هم 
meantemp": "y"})‏ 7 
BESRE SECC SE CIES)‏ 


ds y humidity wind_speed meanpressure year month 
86 2013-01-01 10.000000 84.500000 6.66 1015۰666667 73 1 
3 2013-01-2 7.400000 92.000000 2.980000 1017.800000 3 1 
2 2013-01-03 7.166667 87 . 000000 4.63333 1018.666667 2013 3 
3 2013-01-4 8.666667 71.333333 1.233 1017.166667 2013 3 
4 2013-01-5 6.000000 3 3.700000 1016.500000 213 1 
1457 2016-12-28 1 68.043478 3.547826 1015.565217 6 12 
1458 2016-12-29 5 87.857143 6.000000 1016.904762 2016 12 
1459 2016-12-39 8 89.666667 6.266667 1017.904762 2016 12 
1460 2016-12-31 2 87 . 6 7.0 1016.100000 6 12 
1461 2017-01-01 1 068 6. 666 1016.000000 7 1 


[1462 rows x 7 columns] 


الآن فيما يلي كيفية استخدام نموذج 0700160 12065001 للتنبؤ بالطقس باستخدام بايثون: 


عم یت عن رقم 


from prophet import Prophet 

E OMI اههد‎ PLO AMOOEE علت 1م لاعت لام عزن للم‎ COMPONeNES PLOY 
model = Prophet () 

180061 . ۶11 )۶01۳6669 E Oe Ca) 

۴016029 65 = model make ۴۱ ۲۵یا‎ 0212۴ Fame )06131 009-3 65( 
predictions = model.predict (forecasts) 

10101017۷ )۵061 , 601 01 085( 


1w 1۳ 6m ۷ all 


ds 

هذه هي الطريقة التي يمكنك من خلالها تحليل الطقس والتنبؤ به باستخدام بايثون. 
الملخص 

التنبؤ بالطقس هو مهمة التنبؤ بأحوال الطقس لموقع ووقت معين. باستخدام بيانات وخوارزميات 
الطقس» من الممكن التنبؤ بأحوال الطقس لعدد 12 من الأيام القادمة. أتمنى أن تكون قد أحبيت 
هذه المقالة حول تحليل الطقس والتنبؤ باستخدام بايثون. 


تحليل وقت الشاشة باستخدام بايثون 


18 


2) تحليل وقت الشاشة باستخدام بايتثون 11۳6 Screen‏ 


Analysis using Python 


يتبح لك تحليل وقت الشاشة (41217515 111726' ١عءإءS)‏ معرفة مقدار الوقت الذي تقضيهفي 


تیا عن ذلك. لذلك. إذا كنت تريد معرفة كيفية تحليل وقت الشاشة. فهذه المقالة مناسية لك. 
في هذه المقالته سوف آخذك خلال مهمة تحليل وقت الشاشة باستخدام بايثون. 


تحليل وقت الشاشة 
تحليل وقت الشاشة هو مهمة تحليل وإنشاء تقرير عن التطبيقات والمواقع التي يستخدمها 
المستخدم عن مقدار الوقت. تتمتع أجهزة 16م مل بواحدة من أفضل الطرق لإنشاء تقرير وقت 


الشاشة. 


Daily 6 


2h 45m 0 47% from last week 


Social Productivity & Finance Creativity 


3h 15m 32m 29m 


Total Screen Time 5h 31m 


بالنسبة لمهمة تحلیل وقت الشاشة وجدت مجموعة بیانات مثالية تحتوي على بیانات حول: 


التاریخ. 

استخدام التطبیقات. 

عدد الاشعارات من التطبیقات. 
عدد مرات فتح التطبیقات. 


في القسم آدناه. سوف آخذك خلال مهمة تحلیل وقت الشاشة باستخدام بايثون. 


علم البیانات: عن طريق الامئلة 11 


تحلیل وقت الشاشة باستخدام بایئون 
لنبدأ مهمة تحلیل وقت الشاشة عن طریق استیراد مکتبات بایثون ومجموعة البیانات الضرورية: 


1۳001۲ pandas 25 0 

311۳00 MUMDY aS MP 

5 35 ۵20۵1۵98 .۰ 0101۷ 1۳001 
0و وج واه ژطه GEAN‏ ۵101۷ 110001 


كك 1115 دعاك AOS‏ > اد هو ESM‏ ماع غذ 24م = daa‏ 
print (data.head )((‏ 


Date Usage Notifications Times opened App 
Q0 08/26/2022 38 7e 49 Instagram 
1 22 39 43 48 Instagram 
2 08/28/22 64 231 55 Instagram 
3 2 14 35 23 Instagram 
4 08/30/22 3 19 5 Instagram 

5 0 ماه ما » ٠‏ ۰ ۰ 5 1 5 ۰ 55 
دعنا الان نلقي نظرة على ما إذا كانت مجموعة البيانات تحتوي على أي قيم فارغة ( 121111 


(values‏ أم لا: 
data.isnull )( .sum ()‏ 


Date 

Usage 
Notifications 
Times opened 
App 

dtype: int64 


لا تحتوي مجموعة البيانات على أي قيم خالية. دعنا الآن نلقي نظرة على الإحصائيات الوصفية 
للسانات: 


O © © © © 


print (data.describe () ) 


Usage Notifications Times opened 


count 54.000000 54.000000 54+ 00 
mean 65.037037 117.703704 61.481481 
std 58.317272 97.017530 43. 5 
min 1.000000 8.000000 2.000000 
25% 17 . 0 25.750000 23.0 
50% 58 . 500000 99.000000 62.0 
75% 90. 0 188 250000 96 . 0 
max 244 . 000000 405.000000 192.000000 


لنبدأ الآن بتحليل وقت الشاشة للمستخدم. سأنظر أولآفي مقدار استخدام التطبيقات: 


Oar (data ۴۲2۳۵۲0016 ,‏ عدم = سواط 
x = "Date",‏ 
"Usage",‏ = ۷ 
color="App ",‏ 


دعنا الآن نلقى نظرة على عدد مرات 


ب 


ال 


7 


Date 
تت‎ 


2 =data 


px.bar (data frame 


title="Times Opened ") 


y = "Times opened", 
color="App", 


x = "Date", 


figure. show )( 
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دعنا الان نلقى نظرة على عدد الإشعارات من التطبيقات 
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px.bar (data 6 


111 le INSET ۴10231 وطه‎ ۲( 
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figure. show () 


figure 
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figure. show )( 
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Times Opened 
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نستخدم بشكل عام هواتفنا الذكية عندما نتلقى إشعارًا من أي تطبيق. فلنلق نظرة على العلاقة بين 
عدد الإشعارات ومقدار الاستخدام: 


EOS ۶۰ 86215532 OEE EES 3 CECA م‎ 

262۱۲011 21593213525 , ۳ 

ت۱2 

| 0211018 ۱۲011۴1" حه 2 51 

"| 162-۷0195 10001 ل 

title = "Relationship Between Number of 
2661 221596326525 And 15929026 ۲ 
figure. show )( 


Relationship Between Number of Notifications and Usage 


Usage 
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Notifications 


هناك علاقة خطية بين عدد الإشعارات ومقدار الاستخدام. هذا يعني أن المزيد من الإشعارات 
يؤدي إلى زيادة استخدام الهواتف الذكية. 

الملخص 

هذه هي الطريقة التي يمكننا بها تحليل وقت الشاشة للمستخدم باستخدام لغة برمجة بايثون. 
تحليل وقت الشاشة هو مهمة تحليل وإنشاء تقرير عن التطبيقات والمواقع التي يستخدمها 
المستخدم عن مقدار الوقت. آمل أن تكون قد أحببت هذه المقالة حول تحليل وقت الشاشة 
باستخدام بايثون. 


تحليل سوق الأسهم باستخدام بايثون 22 


٩۹۰0] تحليل سوق الأسهم باستخدام بايثون‎ 3 
Market Analysis using Python 

يعني تحليل سوق الأسهم (5زوتولدصك )St0ock Market‏ تحليل الاتجاهات الحالية والتاريخية 
في سوق الأوراق المالية لاتخاذ قرارات البيع والشراء المستقبلية. يعد تحليل سوق الأوراق المالية 
أحد أفضل حالات استخدام علم البياناتفي التمويل. لذاء إذاكنت تريد تعلم كيفية تحليل سوق 
الأوراق الماليةء فهذه المقالة مناسبة لك.في هذه المقالةء سأطلعك على مهمة تحليل سوق الأسهم 


تحليل سوق الأسهم باستخدام بايثون 

لتحليل سوق الأسهم. سأجمع بيانات أسعار أسهم 00010).في نهاية هذه المقالة. ستتعلم تحليل 
سوق الأوراق المالية بشكل تفاعلي باستخدام لغة برمجة بايثون. لنبدأ بجمع بيانات أسعار أسهم 
.Google‏ سأستخدم ۵ ۸۱۳۲ من Yahoo Finance‏ لجمع بيانات أسعار الأسهم. 
يمكنك معرفة المزيد عن ۸۳۲ هنا. 


إليك الآن كيفية جمع بيانات أسعار أسهم :Google‏ 


0 وه 22025 111۳001 

11۳00011۲ ۷۶112866 25 YE 

import datetime 

from datetime import date, timedelta 
110۳001۲ PIOEIY.GEAaDR ژطله‎ eC ES و2‎ 0 
1۳0011 0101۷ I ۵2016۵98 و‎ ۶۶ 


today = date.today )( 


041  CEOdaV.SEFEEIMme(LGY SM AE) 

gC 6253 = ال‎ 

d2 = date.today() - timedelta (days=365) 
02 < 02 ۰511۴11106 LSE eM cA) 

dake > QZ‏ سياه 


data = yf.download ) ' 006 ', 
82۳296۳ 0216۶ 
end=end date, 
progress=False) 

data ["Date"] = data.index 

0283 < 04265210 223:7 ۲۵۵۵۲, HIG, م۲1۵۲‎ 

۳ انارو ور اذو اروت و وق‎ VOI UME IN 
03269529526 _ index 2ع هه 31012 7ت سس مه عدك)‎ 
print (data.head() ) 
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Date Open High Low Close Adj Close \ 
6 2021-07-12 2596.669922 2615.399902 2592.000000 2611.280029 9 
1 2021-07-13 2617.629883 2640.840088 2612.739990 2619.889893 3 
2 2021-07-14 2638.030029 2659.919922 2637.959961 2641.649902 2641.6492 
3 2021-07-15 2650.000000 2651.899902 2611.959961 2625.330078 2625.338 
4 2021-07-16 2632.820068 2643.659912 2616.429932 2636.909912 72 


Volume 
847200 
830900 
895600 
829300 
742800 


۵ شرا ی س د 


كلما قمت بتحليل سوق الأسهم. ابدأ دائمًا بمخطط الشموع .)candlestick chart)‏ مخطط 
الشموع هو أداة مفيدة لتحليل تحركات الاسعار لأسعار الأسهم. إليك كيفية تصوير مخطط 
الشموع لأسعار أسهم :Google‏ 


figure = go.Figure ) 0212 ] 90. 03201 ©5151 16 ) 5-03 ] "ع3"‎ [ , 
006۳۴0212 ["Open"], 
1ظ‎ 01202122 ] HORLI, 
101-033] ۲1۵۳۲ , 
close=data["Close"]) 1) 
EA UEC مم66 > تك لع تع ) 2ت 21 ول من‎ 15 SEOCE EEE ره‎ 
xaxis ۲2۳9691 ides د‎ 1 2-5 
figure. show )( 


Google Stock Price Analysis 
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المخطط الشريطي (7106 :62) هو أيضًا تصوير مفيد لتحليل سوق الأوراق المالية» على وجه 
التحديد على المدى الطويل. إليك كيفية تصوير أسعار إغلاق آسهم 16ع00) باستخدام مخطط 
شريطي: 


figure = px.bar (data, x = "Date", y= "Close") 
figure. show )( 


تحليل سوق الأسهم باستخدام بايثون 
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يعد شريط تمرير النطاق (5110617 #عدهء) أحد الأدوات القيمة لتحليل سوق الأوراق المالية. 
يساعدك على تحليل سوق الأوراق المالية بين نقطتين محددتين من خلال تحديد الفترة الزمنية 
بشكل تفاعلي. إليك كيفية إضافة شريط تمرير النطاق لتحليل سوق الأسهم: 
figure = 02۶, 13106 (data, x='Date', y='Close'",‏ 
title='Stock Market Analysis with‏ 
Rangeslider'")‏ 


۴1016 . ۵4266 xaxe sS (E هالول 715 06 امد روس‎ TE Ue) 
figure. show )( 


Stock Market Analysis with Rangeslider 


Close 
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ل ا ا 0 


استخدم شريط تمرير النطاق لتحليل سوق الأوراق المالية بشكل تفاعلي بين نقطتين 
ميزة تفاعلية أخرى يمكنك إضافتها لتحليل سوق الأسهم هي محددات الفترة الزمنية ( عدن 
5۵16601 04تزءم). محددات الفترة الزمنية هي مثل الأزرار التي تعرض لك الرسم البياني 
لفترة زمنية محددة. على سبيل المثال» سنةء ثلاثة آشهر ستة آشهر إلخ. إليك كيفية إضافة أزرار 
لاختيار الفترة الزمنية لتحليل سوق الاسهم: 
figure = 0۶, 13106 (data, x='Date', y='Close ,'‏ 


title='Stock Market Analysis with Time Period 
Selectors ۳ 


۴1 016 . ۵02۲6 xaxes) 
rangeselector=dict) 
buttons=list] ) 
dict (count=1, label="1m", step="month", 
stepmode="backward"), 
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dict (count=6, label="6m", step="month", 
stepmode="backward"), 

dict (count=3, label="3m", step="month", 
stepmode="backward"), 

dict (count=1l, label="ly", step="year", 
stepmode="backward"), 

dict (step="all") 


igure. show )( 


Stock Market Analysis with Time Period Selectors 


ım 6m 3m 1۷ لأا‎ 
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Close 
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تؤثر عطلة نهاية الأسبوع أو موسم العطلات دائمًا على سوق الأوراق المالية. لذلك إذاكنت ترغب 
في إزالة جميع سجلات اتجاهات عطلة نهاية الأسبوع من تصوير سوق الأسهم الخاص بك 
فيما يلي كيف يمكنك القيام بذلك: 


2۱0 ۲ اعد ClO, IME‏ > معط اد (Mal,‏ همم دم - كشلل مط 
۲ رال 2۱0220 ۲ ر ۲ 12 (0) 
title="Stock Market Analysis by Hiding‏ 
Weekend Gaps )"‏ 
xaxes)‏ 05096 2219025 
< [ 121061016215 
SOURIS ۲] ۲9۵۲۲, SURL)‏ 61 03 


figure. show )( 


Stock Market Analysis by Hiding Weekend Gaps 
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تحليل سوق اأسمم باستخدام بايثون 


هذه هي الطريقة التي يمكنك بها تحليل سوق الأسهم باستخدام بايثون. إذا كنت تريد معرفة كيفية 
التنبؤ بسوق الأوراق الماليةء فيمكنك التعلم هنا. 


الملخص 

هذه هي الطريقة التي يمكنك بها استخدام لغة برمجة بايثون لتحليل سوق الأوراق المالية بشكل 
تفاعلي. يعني تحليل سوق الأسهم تحليل الاتجاهات الحالية والتاريخيةني سوق الأوراق المالية 
لاتخاذ قرارات البيع والشراء المستقبلية. آمل أن تكون قد أحببت هذه المقالة حول تحليل سوق 
الأسهم باستخدام بايثون. 


4) التنبؤ بالأعمال التجارية باستخدام بايثون Business‏ 


Forecasting using Python 
أحد تطبيقات التنبؤ بالسلاسل الزمنية‎ 19 Forecasting) يعد التنبق بالأعمال التجارية‎ 
تنبؤات الأعمال التجارية» نهدف إلى التنبؤ بالمبيعات أو‎ .(Time Series Forecasting) 
النفقات أو الإيرادات المستقبلية باستخدام بيانات السلاسل الزمنية التاريخية التي تم إنشاؤها‎ 
بواسطة الشركة. لذاء إذاكنت تريد معرفة كيفية إجراء التنبو بالأعمال التجاريةء فهذه المقالة مناسبة‎ 

لك.في هذه المقالة» سوف آخذك خلال مهمة التنبؤ بالأعمال باستخدام بايثون. 


لماذا یحتاج العمل التجاري إلى التنبق بالأعمال التجارية؟ 

فحت کل ختركة عن استراتیجیات لعحسین آرباحها. پلعب متخصصو علم الییانات د رقیسیا 
في توفیر آکثر التنبقات دقةفي أي وقت. دائمًا ما تکون البیانات التي يتم إنشاؤها من قبل الشركة 
في متناول اليد لتحلیل السلوك المستقبلي للعملاء المستهدفین. من خلال التنبؤ باتجاهات 
الأعمال المستقبلية. يمكن للشركة اتخاذ قرارات آفضل لتحسین أدائهاني المستقبل. 

آمل أن تکون قد فهمت سبب احتیاج الشركة الیوم إلى استخدام تقنیات التنبو بالأعمال. التنبو 
بالمبیعات أو الایرادات أو التفقات هي بعض حالات استخدام التنبو بالأعمال التجارية. لذلك. 
في القسم آدناه سوف آخذك خلال مهمة التنبؤ بالاعمال التجارية حیث سنهدف إلى توقع 
الایرادات الفصلية لشركة ۸01425 يتم جمع البیانات التي آستخدمها لهذه المهمة یدویّا من 
تقاریر المبیعات ربع السنوية من ۰۸01025 یمکنك تنزیل مجموعة البیانات من هنا. 


التنبؤ بالأعمال التجارية باستخدام بایئون 
لنبدأ بمهمة التنبؤ بالأعمال التجارية عن طريق استیراد مکتبات بایثون ومجموعة البیانات 
الضروریة: 


1۳0011۲ pandas وه‎ 0 

from datetime import date, timedelta 

import datetime 

110۳0 اط0‎ ۵1010111 DOOYOO AS PLE 

11 ۰51-۷16 . 196 ) ۲۶176۵1۲۳11۷۵1 0111 ( 

From 52651000615 , Esa. 56250881 Import seasonal 16 
۴101 5265100061 5 . 912۳0131 ]دمص واه 692۳01 . و6‎ BIO Back 
۴101 52651000615 ۰. 282 , 211102 model 7001] ARIMA 

import 215100061 و‎ . 321 as sm 

import warnings 


02162 < 0.1620 ترفك‎ adidas 1031161117 Sale SE SM) 
911 DIE )0212( 


علم البيانات: عن طريق الامثلة 


Time Period Revenue 


8 200601 1517 
1 2000602 1248 
2 206093 1677 
3 200604 1393 
4 20101 1558 
83 22604 5142 
84 2201 5268 
85 202102 5077 
86 20203 5752 
87 2204 5137 


[88 rows x 2 columns] 


تحتوي مجموعة البیانات على عمودين؛ الفترة الزمنية (كهااء۴ 1126© والإيرادات 
(عتاجء1867). يحتوي عمود الفترة الزمنية على الإيرادات ربع السنوية لشركة 401025 من 
0 إلى ۰2021 ويحتوي عمود الإيرادات على إيرادات المبيعات بالملايين (باليورو). دعونا 
نلقي نظرة على عائدات المبيعات ربع السنوية لشركة 401025: 

1۳0012 0101۷ ۰. 201۵98 و‎ P< 
figure = 0۶, 13106 (data, x="Time Period", 

y="Revenue", 

title='Quarterly Sales Revenue of Adidas in 
MORSE) 
figure. show )( 


Quarterly Sales Revenue of Adidas in Millions 
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تعد بيانات إيرادات المبيعات الخاصة بشركة ۸01025 موسمية حيث تزيد الإيرادات الفصلية 
وتنخة م كل ربع سنة. فيما يلي كيفية التحقق من موسمية أي بيانات سلاسل زمنية: 


۲69111۲ = 5223521211 decompose )0312 ] ۲5۵۲6۳896 ۳ 
model='multiplicative', freq = 30 ) 

۶10 < OLE 2100225 )( 

۶10 < 19۱711] POE )( 

روم 10) 06۳69 مد با56 111۰ 
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Revenue 


سأستخدم نموذج Seasonal AR1MA (SAR1MA)‏ للتنبؤ بإيرادات المبيعات ربع السنوية 
لشركة ۰۸010125 قبل استخدام نموذج ۰5۸11۷1۸ من الضروري إيجاد قيم م وك وو. يمكنك 
معرفة كيفية العثور على قيم م و4 و و من هنا. 
نظرًا لأن البيانات ليست ثابتة (562610112137 +270 فان قيمة 0 هي 1. للعثور على قيم م و ۰0 
يمكننا استخدام مخططات الارتباط التلقائي (210001612001) والارتباط التلقائي الجزئي 
:(partial autocorrelation plots)‏ 

0, 01 0۲1۳9 , 2۱2 0601۲1612108 ۴10 )0212 LEevenuel ll) 
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Partial Autocorrelation 
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الآن إليك كيفية تدریب نموذج ٩۸131۷1۸‏ للتنبو بالایرادات ربع السنوية لشركة 01025: 


11006 1 - مره‎ . 253 . 5265۳02606 . 551۲1۳1226 (data ] 'Revenue"], 
GECE ), 4, ( 
Seasonal بلق 87 عرهاه‌غدی‎ 47 2 
model=model. fit () 
print (model .summary )( ) 


SARIMAX Results 


Dep. Variable: Revenue No. Observations: 88 

Model: SARIMAX(5S, 1, 2)x(5, 1, 2, 12) Log Likelihood -548.520 

Date: Mon, 95 Sep 2022 AIC 1127.041 

Time: 07:45:33 BIC 1161.803 

Sample: 6 HQIC 1140.921 
- 8 

Covariance Type: همه‎ 


8۰ 

0. 

8. 

0. . 
2۳-2 0 362.141 -.3 9.998 -710.91@ 708.656 
2۳4 -1,8 312.728 -6,4 0.997 -614 7 611.594 
ar.S.L36 -0.7832 174.955 -0. 004 0.996 -343.688 342.122 
ar.S.L48 -7 5663 -6.4 0.997 -9.423 99.054 
ar.S.L6@ -0.,0098 8.921 -0. 01 ووو.6‎ -17,6 17.476 
ma.S.L12 0.3046 362.082 261 6559 3 709.972 
ma.S.L24 0.8602 2.641 6,664 0.997 -433 , 548 435.269 
sigma2 1.9696+65 5+ع4.61‎ 0.476 6.634 -5.96e+05 9.78e+05 


Ljung-Box (L1) (Q): 0.00 Jarque-Bera (38): 427.98 
Prob(Q): 0.96 Prob(38): 9.0 
Heteroskedasticity (H): 7.35 Skew: -2.04 
Prob(H) (two-sided): 0.00 Kurtosis: 13.97 


الآن دعونا نتوقع الإيرادات ربع السنوية لشركة ۸:26 للأرباع الثمانية القادمة: 


predictions = model.predict (len (data), len (data)+7) 


التنبؤ بالا عمال التجارية باستخدام بايثون 31 
PETE (PECALE EONS)‏ 


88 6078.793918 
89 5186.311373 
96 6293.196600 
91 5751.905629 
92 5911.946881 
93 5499.784229 
94 6389.627988 
95 5728.806969 
Name: predicted_mean, dtype: float64 


data ["Revenue"] .plot (legend=True , 
label="Training Data ," 
figsize= (15, 10(( 

predictions.plot (legend=True, label="Predictions") 
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الملخص 

هذه هي الطريقة التي يمكنك بها إجراء التنبؤ بالأعمال التجارية باستخدام لغة برمجة بايثون.في 
تنبؤات الأعمال التجارية. نهدف إلى التنبق بالمبيعات أو النفقات أو الإيرادات المستقبلية 
باستخدام بيانات السلاسل الزمنية التاريخية التي تم إنشاؤها بواسطة الشركة. أتمنى أن تكون قد 
آحببت هذه المقالة حول التنبؤ بالأعمال التجارية باستخدام بايثون. 


نظام توصية الأخبار باستخدام بايثون 32 


5) نظام توصية الأخبار باستخدام بايثون News‏ 


Recommendation System using Python 
نظام التوصية (57256677 )هو تطبيق شائع لعلم البيانات. تستخدم جميع‎ 
مواقع الويب الشهيرة التي تزورها تقريبًا أنظمة التوصية. كما يوحي الاسم. فإن نظام التوصية‎ 
هو تطبيق يوصى بالمقالات الإخبارية بناء‎ )news recommendation system) بالأخان‎ 
على الأخبار التي يقرأها المستخدم بالفعل. لذلك. إذاكنت تريد بحن كيف ا نظام توصيات‎ 
الأخبار. فهذه المقالة مناسبة لك.في هذه المقالة. سوف أطلعك على كيفية إنشاء نظام توصيات‎ 

أخبار باستخدام بايثون. 


كيف يعمل نظام توصيات الأخبار؟ 
عندما تزور آي موقع ویب. فإنه يوصي بمحتوى مشابه بناءً على ما تشاهده أو تقرأه بالفعل. تعتبر 
يُعرف باسم التصفية القائمة على المحتوی (ع166710ظ „(Content-based‏ 


تستخدم جميع مواقع الويب الإخبارية الشهيرة أنظمة توصية قائمة على المحتوى مصممة للعثور 
على أوجه التشابه بين الأخبار التي تقرأها والمقالات الاخبارية الأخرى على موقعها على الويب 
للتوصية بالمقالات الإخبارية الا کثر تشابهًا. 


أتمنى أن تكون قد فهمت الآ نكيف يعمل نظام توصية الأخبار.في القسم أدناه. سوف أطلعك على 
كيفية إنشاء نظام توصيات الأخبار باستخدام لغة برمجة بايثون. 


نظام توصية الأخبار باستخدام بايثون 

مجموعة البيانات التي أستخدمها لإنشاء نظام توصيات الأخبار مأخوذة من o۴یoاMic.‏ نظرًا 
لأن البيانات كانت بحاجة إلى الكثير من التنظيف والإعداد. فقد قمت بتنزيل البيانات وأعدتها 
لإنشاء نظام توصية قائم على المحتوی. يمكنك تنزيل مجموعة البيانات هنا (يُرجى تنزيل 
البيانات بتنسيق 0517)). 


لنبدأ الآن باستيراد مكتبات بايثون الضرورية ومجموعة البيانات التي نحتاجها لبناء نظام توصية 
بالاخبار: 


IMPOEE 28217 aS NP 

1۳0011۲ Pandas 25 0 

i OM 516168110 ۰ 26 20025 اجه 110001۲ 2621202 كت‎ 

E OM 9161681۳ , 106 131 65 , 02117101 56 ]دن ل‎ COSINE SAMI 1 Ey 
import plotly.express as px 

11000 101۷ EAP OMI 26055 وج‎ 6 
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02102 < 00۰۳1620 09 NOMS ESM) 
print (data.head() ( 


ID News Category Title \ 

@ N88753 lifestyle The Brands Queen Elizabeth, Prince Charles, an... 

1 N45436 news Walmart Slashes Prices on Last-Generation iPads 

2 44 health 5@ Worst Habits For Belly Fat 

3 5 health Dispose of unwanted prescription drugs during ۰ 

4 N93187 news The Cost of Trump's Aid Freeze in the Trenches... 
summary 

@ Shop the notebooks, jackets, and more that the... 

1 Apple's new iPad releases bring big deals on 1... 

2 These seemingly harmless habits are holding yo... 

5 NaN 

4 Lt. Ivan Molchanets peeked over a parapet of s... 


دعونا نلقي نظرة على فثات الأخبارفي مجموعة البيانات هذه: 


# Types of News Categories 


۰2۲69۵13165 = 0212 ] ۲۸۲۵۲۷5 02۵۲6690117۲ | value COUR ES )( 


label = categories.index 
counts = categories.values 
figure = px.bar (data, x=label, 
VY < COUR ES, 
title="Types of News Categories") 
figure. show )( 


Types of News Categories 
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توجد طريقتان لإنشاء نظام توصية باستخدام مجموعة البيانات هذه: 


1. إذا اخترنا عمود فئة الأخبار (حصدای )News Category‏ كميزة سنستخدمها 
للعثور على أوجه التشابه. فقد لا تساعد التوصياتفي جذب انتباه المستخدم لفترة 
أطول. لنفترض أن مستخدمًا يقرأ أخبارًا عن الرياضة بناءٌ على مباراة کریکیت ويحصل 
على توصيات إخبارية حول رياضات أخرى مثل المصارعة والهوكي وكرة القدم وما 
إلى ذلك. والتي قد تكون غير مناسبة وفقًا للمحتوى الذي يقرأه المستخدم. 


نظام توصية لأخبر باستخدام بايثون 


2. الطريقة الأخرى هي استخدام العنوان أو الملخص كميزة للعثور على أوجه التشابه. 
ستقدم توصيات أكثر دقة لآن المحتوى الموصى به سيعتمد على المحتوى الذي يقرأه 
المستخدم بالفعل. 


لذلك یمکننا استخدام العنوان (616) أو ملخص «511112177) المقال الإخباري للعثور على 
أوجه التشابه مع المقالات الاخبارية الأخرى. هنا سأستخدم عمود العنوان. إذا كنت ترغبفي 
استخدام عمود الملخص. فقم أولاً بإسقاط الصفوف ذات القيم الخالية (72105 [0101). حيث 
يحتوي عمود الملخص على أكثر من 5000 قيمة فارغة. 

فيما يلي كيف یمکننا إيجاد آوجه التشابه بين المقالات الإخبارية عن طريق تحويل نصوص عمود 
لعنوان إلى متجهات رقمية ثم ٍیجاد آوجه التشابه بین المتجهات العددية باستخدام خوارزمية 
تشابه جيب التمام (حصط‌تتمهله :(cosine similarity‏ 


feature = 0433 ] ۲۲116۲ [ 01151 )( 

Lfidf = text.TfidfVectorizer (input=feature, 

SEO MORASS = ENG LT SR) 

EE AE malls > CETL EI و توت‎ OEM ) 2 اه‎ 2 

811۳0112۳716۷7 2 COSA 11011 211 ۷ )۶10۴ 0۵ <) 


الآن سأقوم بتعیین عمود العنوان کفهرس للبیانات حتی نتمکن من البحث عن توصیات المحتوی 
من خلال اعطاء العنوان کمدخل: 


indices = pd.Series (data.index, 
index>da cal ۲۲1۲16 ll) ورم سم‎ 00011 02۲65 )( 


الآن فيما يلي كيفية إنشاء نظام توصيات الأخبار: 


def Mews 252610222021132 ) 2167 520429 22621 ات 1ك‎ ۶ 
112102642 — 201-665 ]۲1116[ 
5110112۳711۷7 5 601225 = 11151 ) 0 116 26ت‎ (SIME 12 6 7] J) 
51101 19۳ 1 5660233 < SOE EEA 8 لسر‎ 2122557 80 
1:6۷ <1 210002 x: ]11[ , reverse=True) 
91۳112۳710۷7 و60۲6 ت11 911011 > وعدهعو‎ ]0 :10[ 
111 mdi ees > انا‎ Eo 1 ا م او 11۱۳ كد‎ 
return 0212 ] ۲۳116۲1 ۰.1106 [newsindices] 


11 (news Eecomnmendateion(, Walmart slashes ومع 1ظ‎ OM اوه‎ 
660861961018 15208 "(( 


1 Walmart Slashes Prices on Last-Generation 5 
83827 ۷۱۵10۵۳ 5 Black Friday 2019 ad: the best deals... 
76024 walmart Black Friday 2019 deals unveiled: Huge... 
90316 Us consumer prices up 0.4% in October; gasolin... 
89588 Consumer prices rise most in 7 months on highe... 
32839 Inside the next generation of irons 
37970 Walmart and Kroger Undercut Drugstore Chains’ ... 


100684 Nissan slashes full-year forecast as first-hal... 
74916 The Top Deals at Walmart Right Now 
39634 Federal Reserve slashes interest rates for thi... 


Name: Title, dtype: object 
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هذه هي الطريقة التي يمكنك بها إنشاء نظام توصية بالاخبار باستخدام لغة برمجة بایشون. 
الملخص 

تستخدم جمیع مواقع الویب الاخبارية الشهيرة آنظمة توصية قائمة على المحتوی مصممة للعثور 
على أوجه التشابه بين الأخبار التي تقرأها والمقالات الاخبارية الأخرى على موقعها على الویب 
للتوصية بالمقالات الإخبارية الأكثر تشابها. أتمنى أن تكون قد أحببت هذه المقالة حول كيفية 
إنشاء نظام توصية بالأخبار باستخدام بايثون. 


تحليل مبيعات الايفون باستخدام بايثون 


o 


3 


iPhone تحليل مبيعات 1۳۳۴086 باستخدام بایئون‎ 6 
Sales Analysis using Python 


تعد أجهزة 1۳0۳65 ۸16 من بين الهواتف الذكية الأكثر مبيعافي جميع أنحاء العالم. هناك 
منافسة كبيرة بين العلامات التجارية للهواتف الذكيةفي الهند. حيث يمكنك الحصول على أحدث 
التقنياتني هاتف ذكى بنصف سعر ع1۳006. لا تزال هناك مبيعات عالية من أجهزة 1۳2006 
في الهند. لذلك إذاكنت ترغبفي تحليل مبيعات عددهط18في الهند. فهذه المقالة مناسية لك.في 
فل المقالةه سوف أطلعك على مهمة تحليل مبيعات 1۳1016 باستخدام بايثون. 


تحليل مبيعات 1۳016 باستخدام بايثون 
بالنسبة لمهمة تحليل مبيعات 1۳۳076 قمت بجمع مجموعة بيانات من 162216 تحتوي على 
بيانات حول مبيعات أجهزة 10126 في الهند على 1316م111. ستكون مجموعة بيانات مثالية 
لتحليل مبيعات 086 الهند. يمكنك تنزيل مجموعة البيانات من هنا. 


دعنا الآن نستورد مكتبات بايثون ومجموعة البيانات اللازمة لبدء مهمة تحليل مبيعات عه ط12: 


10117 . 62001695 as Px 
۳1011 وه داعت ژطه هرد صن‎ O 


1۳0011۲ Candas وه‎ 0 
IMPOEE 817 وه‎ NP 


1۳091 
۰۱9۹ 


0262 < 0۰1620 697 APOE 010016015 ۰ كه‎ 
print )02 12 ۰.1620 )( ( 


Sale Price ١ 
4996© 
84966 
s4900 
77666 
77000 


Brand 
Apple 
Apple 
Apple 
Apple 
Apple 


Product Name \ 
APPLE iPhone 8 Plus (Gold, 64 GB) 
APPLE iPhone 8 Plus (Space Grey, 256 68) 
APPLE iPhone 8 Plus (Silver, 256 68( 
APPLE iPhone 8 (Silver, 256 68( 
APPLE iPhone 8 (Gold, 256 68( 


Product URL 
https://www. 11 قعام‎ + .com/ apple-iphone-8-plus-g8... 
https://www. flipkart.com/apple-iphone-8-plus-s... 
https: //mmw.flipkart. com/apple-iphone-8-plus-s. . . 
https://www. flipkart.com/apple-iphone-8-silver... 
https://www. flipkart.com/apple-iphone-8-gold-2... 


mrp Discount Percentage Number Of Ratings Number Of Reviews \ 


49966 8 3431 
84966 6 3431 
84966 86 3431 
7766© 8 11202 
77666 6 11202 


Upc Star Rating Ram 


MOBEXRGV7EHHTGUH 4.6 2 GB 
108 ملاع‎ 61١8661314 4.6 2 68 
MOBEXRGVGETABXWZ 4.6 2 GB 
MOBEXRGVMZWUHCBA 4.5 2 GB 


MOBEXRGVPK7PFEIZ 4.5 2 GB 


o‏ بر یی ساس هج با بم ساس o‏ شرا بو ساس 
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علم البيانات: عن طريق الامثلة 7 


قبل المضي قدمًاء دعنا نلقی نظرة سريعة على ما إذا كانت مجموعة البيانات هذه تحتوي على أي 
قيم فارغة (null values)‏ أم لا: 


ME )02 12 . 15۳1011 SS )( (‏ شم 


Product Name 
Product URL 

Brand 

sale Price 

mrp 

Discount Percentage 
Number Of Ratings 
Number Of Reviews 
Upc 

star Rating 


© © © © ه © © © © © ه 


Ram 


dtype: int64 


لا تحتوي مجموعة البيانات على أي قيم خالية. الان. دعنا نلقي نظرة على الإحصائيات الوصفية 


print (data.describe )( ) 


sale Price Mrp Discount Percentage Number Of Ratings \ 
count 62.0 62.90 62.0 62.9 
mean 80073.887097 88058.064516 9.951613 22426. 6 
std 34310.446132 34728.827 7.608079 33768.589550 
min 29999 .0 39966 . 0 o. 066066 542.69 
25% 49900. 000000 54966 . 0 6. 000000 740.000000 
50% 7 599. 90 79900. 06660666 16 . 99 2161 . 686 
75% 117100.000000 126956 . 68 14. 0 43470. 000000 
max 146966 . 0666666 149900. 066666 29.90 9599.0 


Number Of Reviews Star Rating 


count 62.0 62.0 
mean 1861.677419 4.575806 
std 2855.883830 0.059190 
min 42 . 0006066 4. 0 
25% 64.0 4. 0 
50% 180.0 4. 0 
75% 3331. 0 4. 0 
max 8161.0 4.7066 


تحليل مبيعات 121026 في الهند 

الآن سوف آقوم بإنشاء إطار بيانات جديد من خلال تخزين جميع البيانات حول أعلى 10 أجهزة 
1۳006 تصنيفاني الهند على +1>21م1111. سيساعد ذلكفي فهم نوع أجهزة 10106 التي تحظى 
بإعجاب أكبرفي الهند: 


م1 SESE EOE‏ كت وه الم ed > 0۵102. SOE‏ 1525نت 1ظ 


نظام توصية الأخبار باستخدام بايثون 


(56 02۳21 6۴01 و و 
(10) ۲۳۲60۰۳630 _اوعط19ظ > rated‏ 10۳69۲ 
Name ll)‏ ۲۲۵0۲۵ ] 2۳۲60 9هط9قظ) 11 


20 APPLE iPhone 11 Pro Max (Midnight Green, 64 GB) 
17 APPLE iPhone 11 Pro Max (Space Grey, 64 GB) 
16 APPLE iPhone 11 Pro Max (Midnight Green, 256 GB) 
15 APPLE iPhone 11 Pro Max (Gold, 64 GB) 
14 APPLE iPhone 11 Pro Max (Gold, 256 GB) 
e APPLE iPhone 8 Plus (Gold, 64 GB) 
29 APPLE iPhone 12 (White, 128 GB) 
32 APPLE iPhone 12 Pro Max (Graphite, 128 GB) 
35 APPLE iPhone 12 (Black, 128 G8B) 
36 APPLE iPhone 12 (Blue, 128 GB) 


Name: Product Name, dtype: object 
وفقًا للبيانات المذكورة أعلاه. يوجد أدناه 37 5 أجهزة عدو ط1۴ الأكثر شهرةفي الهند:‎ 
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دعنا الآن نلقي نظرة على عدد تقييمات أجهزة 1۳106 الأعلى تصنيقًا على :Flipkart‏ 


() وعاصتاهی_ value‏ | 7 11222 01ت طط | iphones = 22022512 malted‏ 
label = iphones.index‏ 
NUNDEE ۵0۶ 5۵۲1۳95 [‏ ] ۳۵۲60 _اوعطونط < COuRES‏ 
اج CELE,‏ اوهن نط) و۲ عدم = هلان ۲1 
GOMES‏ = ۱ 

title="Number of Ratings of Highest Rated 
iPhones") 
figure. show )( 


Number of Ratings of Highest Rated iPhones 


3000 


- 1 1 ١ 1 


42 4%, 44, 
e, e e, 


Number Of Ratings 


م4 
۳ 


44, 
a, 
A 


علم البيانات: عن طريق الامثلة 59 


وفقًا للرسم البياني الشريطي (ادمع 4۲ط) أعلاه. يتمتع ملظ 8 ععمحاطز APPLE‏ (ذهبي 


المراجعات لأجهز ة iPhone‏ الأعلى تقييمًا على غ+121م11آ: 


iphones = Mianest malted | عات لط‎ 11222 [ value وعاصتاهی_‎ )( 
label = iphones.index 
COuURES < اوعطوقظ‎ ۳۵۲60 ] NUNDEE ۵0۶۴ 5۹6۲716۳۷75 ۲ [ 
۴1 هنال‎ = Px. Dar ملا اكه ,۵60 39169۲ظ)‎ 
VY = كه‎ 

title="Number of Reviews of Highest Rated 
1Phones") 
figure. show )( 


Number of Reviews of Highest Rated iPhones 


Number Of Reviews 


على 1111356 من بين أجهزة 151:06 الأعلى تصنيفاني الهند. دعنا الآن نلقي نظرة على العلاقة 
بين سعر بيع أجهزة 1۳106 وتقييماتها على ۳[[1>276: 


۴1 هنال‎ < ۶.50۵1۵ (AAS frame = 042237 xX 10522 OE ۵1 ۳ 
y="Sale Price", size="Discount 
Percentage ," 
trendline="ols ," 
title="Relationship between Sale Price and 
Number OE 90125905 ۶ه‎ 1۴01۵5 KL 
figure. show )( 


نظام توصية الأخبار باستخدام بايثون 


Relationship between Sale Price and Number of Ratings of iPhones 


© © © © 


Sale Price 


0 20k 40k 60k 80k 100k 
Number Of Ratings 


توجد علاقة خطية سالبة بين سعر بيع أجهزة 10:6 وعدد التقييمات. هذا يعني أن أجهزة 
عدهطط1 ذات أسعار البيع المنخفضة تباع أكثرني الهند. دعنا الآن نلقي نظرة على العلاقة بين 
نسبة الخصم على أجهزة 06 على غ1221م111 وعدد التقييمات: 


۴1 هنال‎ = ۶.50۵1۲ (dala ۴12116 = 0428227 ع‎ NUMDeE O ۵۲19 ۳ 
y="Discount Percentage", 1221 
۰ 
trendline="ols ," 
title="Relationship between Discount 
Percentage and Number of Ratings of iPhones )" 
figure. show () 


Relationship between Discount Percentage and Number of Ratings of iPhones 


Discount Percentage 
68 


0 20k 40k 60k 80k 100k 
Number Of Ratings 


هناك علاقة خطية بين نسبة الخصم على أجهزة 121026 على ۵۲۲ )ما۴ وعدد التقييمات. هذا 
يعني أن أجهزة 106 ذات الخصومات العالية تباع أكثرفي الهند. 

الملخص 

هذه هى الطريقة التى يمكنك بها تحليل مبیعات iPhone‏ الهند باستخدام لغة برمجة بايثون. 
بعض النقاط المستفادة من هذه المقالة حول مبيعات 21016 في الهند هی: 


عله یت عن طريق مد 


الهند. 
_ تباع أجهزة 1۳006 ذات أسعار البيع المنخفضة أكثرفي الهند. 
ه تباع أجهزة 1۳006 ذات الخصومات العالية أكثرفي الهند. 


أتمنى أن تكون قد أحببت مقالة تحليل مبيعات 106 باستخدام بايثون. 


تحليل مبيعات )۲1:12 باستخدام بايثون 


۳1012۲6 تحليل مبيعات ۳1:27 باستخدام بايثون‎ ]7 
Sale Analysis using Python 

تقدم ۳13016071 عملية بيع كل عام خلال موسم الاعيادني الهند. يُعرف هذا البيع باسم بيع 18318 
35 8111102. ينصب تركيز البيع على الإلكترونيات من كل نوع. بمافي ذلك الهواتف الذكية 
الرائدة. لذلك. إذا كنت ترغبفي تحليل المنتجات والعروض على بيع منصة التجارة الإلكترونية» 
فهذه المقالة مناسبة لك.في هذه المقالة» سوف أطلعك على مهمة تحليل مبيعات 6هعامنا1 


تحليل مبيعات ۳10127۲ 

لتحليل بيع Big Billion Days‏ kartم1pا۴.‏ بحثت ووجدت مجموعة بيانات مثالية على 
.Kaggle‏ تحتوي مجموعة البيانات على جميع المعلومات حول جميع المنتجات المعروضة 
للبيع. نظرًا لبدء هذا البيعفي 23 سبتمبر يمكننا تحليل اليوم الأول من البيع حيث تم تقديم 
العروض الأكثر جاذبيةفي اليوم الأول بواسطة ۲٤‏ )ما۴ . 


بالنسبة لمهمة تحليل مبيعات 2۲۲ص نا۴ » سأختار فقط بيانات البيع على الهواتف الذكيةفي اليوم 
الأول من بيع :عامنا5. يمكنك تنزيل مجموعة البيانات التي أستخدمها لهذه المهمة هنا. 
يمكنك أيضًا استخدام مجموعة البيانات الكاملة لبيع +5هءام 11 هنا. 


في القسم أدناه. سأنتقل بك إلى تحليل مبيعات 2۲۲ )ما۴ من خلال تحليل العروض على بيع 
الهواتف الذكية. 


تحليل مبيعات ۹٣٤‏ ما۴ باستخدام بايثون 
لنبداً مهمة تحليل بيع ۳1:016276 عن طريق استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


1۳0011۲ Pandas aS 0 

11000 وه ان‎ MP 

import plotly.express as px 
11000 101۷ EEN ژطه‎ 2625 ES 0و‎ 


رت 2502092022 2412341 = تاداع 
(OEE . 5660 )( (‏ 1186 
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name offer_price 0۳381081 ۳۳366 0۴۴60۷ ١ 


8 APPLE iPhone 13 (Blue, 128 GB) 57990 69900 17% off 
1 APPLE iPhone 11 (White, 128 GB) 41990 4s900 14% off 
2 APPLE iPhone 13 (Midnight, 128 GB) 57990 69900 17% off 
3 IAIR D25 1098 1699 35% off 
4 APPLE iPhone 13 (Starlight, 128 G8) 55550 69900 15% off 


total_ratings total_reviews rating \ 


86 13052 1036 4.6 
1 96244 7044 4.6 
2 13052 1036 4.6 
3 11 8 4.1 
4 13052 1036 4.6 


description \ 
'128 GB ROM', '15.49 cm (6.1 inch) Super Reti... 
"128 68 ROM', '15.49 cm (6.1 inch) Liquid Ret... 
'128 GB ROM', '15.49 cm (6.1 inch) Super Reti... 
"32 MB RAM | 32 MB ROM', '4.32 cm (1.7 inch) ... 
'128 GB ROM', '15.49 cm (6.1 inch) Super Reti... 


wn ©‏ 
ص ص ص يم يسم 


created_at 
2622-09-23 22:37 :42.702432+05 : 0 
2022-09-23 22: 37 :42.703432+05 : 0 
2622-09-23 22:37 : 42. 703432+05 0 
2622-09-23 22:37 :42.703432+05 : 0 
2622-09-23 22:37 :42.704431+05 0 
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يحتوي عمود الخصم (صحصتاام 0156011126) المذكورفي مجموعة البیانات على قیم سلسلة. 
لذلك سوف آقوم باٍنشاء عمود خصم جدید من خلال حساب الخصم الذي تقدمه )امن( 


على كل هاتف ذكي: 


= | ل للظم وان ان 04021 = ان ۱۳۳۰۵ CEA‏ 

1272 ] ۲۵۶۴۶۴۵ ۲166۱1 ( 7 1۵12 ] ۲0۲391821 3 0 

دعنا الآن نلقي نظرة على أفضل الصفقات على الهواتف الذكية التي تقدمها 6تهعاح‌نلتآنی 
التخفیضات: 

(6و 002۳21 066001وه ,۲ عصتامع و Di‏ "حاط) وهبا ۲721 _ 0و data.‏ = 06219 ۲00 

dea lS = هوخ‎ 06215 ] name [ ]:15[ ۰72116 0وعصناهع‎ 

label = 46215 . 16 

a ues‏ ۰ او : ]| | لاع امم درم" EOD dea lS)‏ = تاه 

COOSA = ] ۲9۵10۲, ۲110۳۲ 01۲ 

fig = 0و‎ . 1 09۲6 (data= [go.Pie(labels=label, values=counts) [( 

۴1 . ۵02۲6 1210۱۲ EMELE Cece ۲ 11 ]صباهم و۲1 ]وهطو‎ Beals nM عطا‎ 

۳11 باع وتان‎ BIG ص111 1ظ‎ Days ٩2161( 

EG. ۵02۲6 26065 )۵۲۵۲10۶02۲ 12061410۵1660۲ ext OS value ll, 

lex E ORE Si Ze 0U, 

marker=dict (colors=colors, line=dict (color='black'", 
width=3) ( ) 
۶1 0 . 5۳10۲ )( 


تحليل مبيعات ]۳11۳0121 باستخدام بایئون 


Highest Discount Deals in the ۴۱۵۷۵۳۴ Big Billion Days Sale 


60.0240096 60.024009€ 


MarQ by Flipkart M70 Shakti 
Micromax X748 

MarQ by Flipkart MO Jalwa 

SAMSUNG Galaxy F23 5G (Forest Green, 128 GB) 
SAMSUNG Galaxy F23 56 (Aqua Blue, 128 GB) 
SAMSUNG Galaxy S21 FE 5G (Olive, 128 GB) 

SAMSUNG Galaxy F23 SG (Copper Blush, 128 GB) 
SAMSUNG Galaxy 522 Plus 56 (Phantom White, 128 GB) 
OPPO F19 جومم‎ 56 (Fluid Black, 128 GB) 


43.77735085 


57.9252238 


5 
ن 
ل 
> 

هه js lsa ls‏ كا هاه 


57.9252238 


53.33445 45.65415888 


حتى نتمكن من رؤية المنتجات الأعلى تصنيفًا من جميع شرائح الأسعارني هذا البيع. دعنا الآن 
نلقي نظرة على أغلى صفقات الهواتف الذكيةفي التخفيضات: 


Mosil expensive = data 5071 7211065 (OV LOE Ee م1‎ 
ascending=False) 
dea lS < 1۵9] 6206051776 ] ۲۴۵۲6۲ [ ]:101[ ۰۷2116 60۱8۲5 )( 
label = 026215 . 
واصتاهه‎ = ۳۲۵9۲ 25522 5125 ] ۲۵۶۶61 ۳11606۷ [ ]:10[ ۰7211۵5 
661425 = ] ۲9۵10۲ , ۲۱110۳۲ 01۲ 
fig = 0و‎ . 1 09۲6 (data= [go.Pie(labels=label, values=counts) [( 

۶۴1 . ۵02۲6 1210۱ )۲1۲16 Eext= MoS Expensive 0۴۴618 1M 4 

۳11 باع وتان‎ BIG ص111 1ظ‎ DAYS ٩2161( 

م ۲۵116۲ ۵۲10۶0 1206141061660۲ ۵۲۵۲10۶02۲) 260695 1۵02۲6 د EG‏ 
راوج نت E EOE‏ 


marker=dict (colors=colors, 
line=dict (color='black', width=3) ) ) 
۶1 0 . 5107 )( 


Most Expensive Offers in the ۴۱۵۵۲۶ Big Billion Days Sale 


119,990 119,990 


APPLE iPhone 13 Pro Max (Alpine Green, 256 G8) 
APPLE iPhone 13 Pro Max (Sierra Blue, 256 GB) 
APPLE iPhone 13 Pro Max (Graphite, 256 68( 
APPLE iPhone 13 Pro Max (Gold, 256 G8) 

APPLE iPhone 13 Pro (Graphite, 256 GB) 

APPLE iPhone 13 Pro (Graphite, 128 GB) 

APPLE iPhone 13 ((PRODUCTJRED, 512 GB) 
APPLE iPhone 13 Mini ((PRODUCT)RED, 256 GB) 
APPLE IPhone 13 Mini (Pink, 256 GB) 


زره 
00 
0 
0 
Oo‏ 


119,990 


86,990 


119,990 


119,90 109,990 


جميع العروض باهظة الثمن على الهواتف الذكيةفي البيع كانت على أجهزة 10065 ۸016 


علم البيانات: عن طريق الامثلة 


التكلفة اليومية لبيع الهواتف الذكية إلى ۳101271 


الخصومات المقدمة هي نفقات الأعمال. يخفض النشاط التجاري سعر المنتج لزيادة بيعه 
للمنتجات. الخصم يندرج تحت فتة التكاليف الترويجية. 


نحن نستخدم بيانات بیع :115125 على الهواتف الذكيةني اليوم الأول من البيع. لذلك دعونا 
نحسب تكلفة هذا البيع إلى نهء1م ن۴1 على الهواتف الذكية فقطفي اليوم الأول من البيع: 


abel > |]: OE 02292 22166 n 82۵169", 1۵21 OE 1 
1 ces (MRE) Ll 
COU S = عععیه)) مایا‎ SEES _ المع قاعم‎ | 
ناه‎ )0212 ] ۲۵101۳82۵1 02166۳ [( [ 
COLOES < ] ۲9۵10۲ , ۲11 0۳1۲0166۴۲ | 
fig = go.Figure (data= [go.Pie(labels=label, values=counts) [( 
۶۴1 . 1002۲6 1210۱ (Elle text> Total ۲19 وتاصتاهع‎ 0۴۶6۲60 ۰ 
MRE!) 
۳1 یاه ۱ ۱۳۴۵۶ ۵۴) 5ع 2 22 1522157 . ل‎ 6۲ 6 ۲, EXER ا‎ N, 
ادها‎ ORE 91 263 0, 

1۲2 2 161201 61 (colors=colors, 1316201 0۲ (color='black'", 
width=3) ( ) 
۶1 0 . 5107 )( 


Total Discounts Offered Vs. MRP 


E] Total of Original Prices (MRP) 
۱۳ Total of Offer Prices in Sales 


BEEN صه1111ظ ودظ ۶ه عت نت‎ Gays Sale EO ۶1101۵1۱ OM 
9۳08110۳8085 < ۲, 12876594 - 10522822( 


Cost of big billion days sale to flipkart on smartphones = 2‏ 
لذا فان تكلفة الخصم على ٤۲ه)مذا۴‏ على الهواتف الذكية فقط ستكون 23.53.772 دولارًا 
لكمية واحدة فقط من جميع الهواتف الذكية المعروضة للبيع. 


حل 
ار 


تحليل مبيعات ۳1:01216 باستخدام بايثون 


الملخص 

هذه هي الطريقة التي يمكنك بها تحليل مبيعات 1۵75 8111105 8218 نهعام111. لا تترددفي 
الاستلهام من هذه المقالة لتحلیل المزید من بیع 0:ع۳10علی مجموعة البیانات الكاملة هنا. 
آمل أن تكون قد آحببت هذه المقالة حول تحلیل بيع ۳11276 باستخدام بايثون. 


تحليل سا ماخ بو 


8 تحلیل آسعار الماس باستخدام بایئون 10124220201 
Price Analysis using Python‏ 

الماس (413:1020) هو من أغلى الأحجار. يختلف سعر الماس بغض النظر عن الحجم بسبب 
العوامل التي تؤثر على سعر الماس. لذلكء إذا كنت تريد معرفة كيفية استخدام مهاراتك‌في علم 
البيانات لتحليل سعر الماس والتنبو به. فهذه المقالة مناسبة لك.في هذه المقالق. سوف آخذك 
خلال مهمة تحليل أسعار الماس والتنبؤ باستخدام لغة برمجة بايثون. 


تحليل سعر الماس ۱ 

لتحلیل سعر الماس وفقا لخصائصه. نحتاج أولاً إلى مجموعة بیانات تحتوي على آسعار الماس 
بناء على میزاتها. لقد وجدت بیانات مثالية على 16816 تحتوي على معلومات حول الماس 
مثل: 

القیراط (2120/)). 

.(Cut) القطع‎ 

اللون (132ه0010). 

الوضوح (0122167)). 

العمق (طامع(1). 

الجدول (ع12916). 

السعر (۳۲166). 

.(Size) الحجم‎ 

يمكنك تنزيل مجموعة البيانات هذه من هنا.في القسم أدناه» سوف آخذك خلال مهمة تحليل 


تحليل أسعار الماس باستخدام بايثون 
لنبدأ مهمة تحليل أسعار الماس من خلال استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


خن 5 نن ب ما هچ ید مه 


0 وه 28029 11۳001 

import numpy as np 

1۳0011 0101۷ ۰. 201۵98 وج‎ PX 
110001 101۷ EAP 0و وج 2655 رظه‎ 


02168 > 0.1620 ترفك‎ ) ۲012۳100۳۴05 ۰ ESM) 
print (data.head () ) 


علم البيانات: عن طريق الامثلة 


Unnamed: © carat cut color clarity depth table price x ۷/۱ 
6 3 0.23 Ideal 8 512 61.5 55.0 326 3.95 8 
1 2 6.21 Premium 8 511 59.8 6260.6 326 3.89 4 
2 3 0.23 Good E vVs1 56.9 65.6 327 4.05 7 
3 4 6.29 Premium 1 ۷52 62.4 58.0 334 4.20 3 
4 5 0.31 Good J 512 63.3 58.0 335 4.34 4.35 


wun سا‎ © 
N 
س‎ 


تحتوي مجموعة البيانات هذه على عمود بدون اسم Unnamed column‏ . سأحذف هذا 
العمود قبل الانتقال إلى أبعد من ذلك: 
data = aa EOD ) 02 0" , axis=1)‏ 
لنبدأ الآزفي تحليل أسعار الماس. سأحلل أولاً العلاقة بين القيراط وسعر الماس لأرى كيف يؤثر 
عدد القيراط على سعر الماس: 
OEE 222515 CEE, WEEE,‏ 0562090552 2ق ك1 EE‏ 
SIE 06۳0۷‏ ,0۵۲ ۷-۲ 


COLOR ۲۵۷۲, 16۳۴011 62۳*۵1 5( 
figure. show )( 


30k cut 
© Ideal 
© Premium 
25k © Good 
© Very Good 
© Fair 
20k 
© © 
لا‎ 15“ 
۴ 
a 
10k 
5 
0 
0 1 2 3 4 5 


carat 


يمكننا أن نرى علاقة خطية بين عدد قيراط وسعر الماس. هذا يعنى أن القيراط الأعلى يؤدي إلى 
سأضيف الآن عمودًا جدیدا إلى مجموعة البيانات هذه عن طريق حساب حجم الماس (الطول 
× العرض »× العمق): 


CEE ZÎ‏ * انلا مهام 5( [STAN < CECA‏ ودتهاه 


تحليل أسعار الماس باستخدام بايثون 


911 116 (OEE) 


carat cut color clarity depth table price & لا‎ <2 
86 0.23 Ideal 8 512 61.5 55.@ 326 3.95 3.98 2.43 
1 2.21 Premium E SI1 59.8 61.6 326 3.89 3.84 1 
2 0.23 Good E Vs1 56.9 65.6 327 4.05 4.07 1 
3 0.29 Premium 1 ۷/52 62.4 58.@ 334 4.20 4.23 2.63 
4 0.31 Good 3 512 63.3 5.6 335 4.34 4.35 5 


53935 0.72 Ideal D 511 60.8 57.6 2757 5.75 5.76 0 
53936 0.72 Good D 511 63.1 55.@ 2757 5.69 5.75 3.61 
53937 6.79 Very Good D SI1 62.8 66.6 2757 5.66 5.68 6 
53938 6.56 Premium H 512 26.6 55.86 2757 6.15 6.12 4 
53939 0.75 Ideal D 512 62.2 55.6 2757 5.83 5.87 4 
size 
38.202030 
34. 6 
38.076885 


46.724580 


© شرا ی سن لم 


51, 0 


53935 115.0 
53936 75 
53937 114.449728 
53938 0 
53939 124.4 


[53940 rows x 11 columns] 


دعنا الآن نلقي نظرة على العلاقة بين حجم الماس وسعره: 


figure = px.scatter (data _ frame = data, x="size," 
۷۵۵۲, Size "size | 
GOO E Loe, Erendline رن‎ 

figure. show () 


160k ۹۳ 
© Ideal 
© Premium 
د‎ © Good 
© Very Good 
120k © Fair 
100k 
تك‎ 80k 
a 
60k 
40k 
20k 
0 . 
0 500 1000 1500 2000 2500 3000 3500 4000 


size 


علم البيانات: عن طريقالامثلة 


يستنتج الشكل أعلاه ميزتين للماس: 
الماس المقطوع المتميز كبير نسبيًًا من الماس الاخر. 
2. هناك علاقة خطية بين حجم جميع أنواع الماس وأسعاره. 


دعنا الآن نلقي نظرة على أسعار جميع أنواع الماس بناءً على لونها: 


DR 0252 ) 02527 KEE,‏ = فلع 
, << 
رگن سجن وه 

۶1 0 . 5۳070 


۳ 


Ideal Premium Fair Very Good 


a 
o 
o 
5 


لال وه om‏ نانسا 
نه نه نكا لها لان E‏ ۳ 
en‏ 5 77 8 9 


price 
5 
o 


ى 


دعنا الآن نلقي نظرة على أسعار جميع أنواع الماس بناءً على وضوحها: 


۶1 = px.box (data, 
ره‎ UNE 
y="price”, 
COLOE CAE E) 
۶1 0 . 5۳07 )( 
١ 


HHI 


Ideal Good Premium Very Good Fair 


clarity 
و‎ 0 2 
5 5 1 
mM vsı 
۱ 2 
۳۱ ۷2 
۲ ۷۶۰ 
5 1 
5 ۴ 


price 


cut 


تحليل أسعار الماس باستخدام بايثون 


دعنا الآن نلقي نظرة على العلاقة بين أسعار الماس والميزات الأخرىني مجموعة البيانات: 


روم . 033 = correlation‏ 
( ك1 وتام مم هد ) MA UES‏ هو [ ۲۵۲3166۵۲ ] 0 كه مالع متمق ).1ل عدم 


price 10 
carat 21 


size 0.925 
x 0.884435 
لا‎ 0.865421 
2 6.09 


table 66.4 
depth -0.017 
Name: price, dtype: float64 


التنبو بسعر الماس 
الآن . سأنتقل إلى مهمة التنبق بأسعار الماس پاستخدام جمیع المعلومات الضرورية من تحلیل 
سعر الماس الذي تم إجراؤه أعلاه. 


قبل المضي قدمّا . سأقوم بتحویل قیم عمود القطع (01111© 66) حیث أن نوع قطع الماس 
هو ميزة قيمة للتنبؤ بسعر الماس. لاستخدام هذا العمود . نحتاج إلى تحویل قیمه الفتوية 
)categorica value)‏ إلى قيم عددية (5ع7211 [121112112). فيما يلي كيف یمکننا تحویلها 
إلى ميزة عددية: 


Olena [EUEY = CAC EUEY MEO 2 1, 
۲۵101 UNL: 2 
۳۱۵۵۵0۳ 3, 
very 60007: 4 


SHAE 2 5 


, 


الان. دعنا نقسم البيانات إلى مجموعات تدريب واختبار: 


#splitting data 

۴01 91616810 , 100061 Selection MOOFE 210 اوه‎ SOE 
كد‎ SS مر اجه ]| ]| عجام) 12۱7 عتاج مهام‎ EE OID) 

۷ SNS 21127 )02۵12 ] ] ۲8166۷۲11 ( 


eS SBE‏ ات < 155816 تا تاد 9 ار 
م اد 53815 
random state=42)‏ 


الآن سأقوم بتدريب نموذج التعلم الآلي لمهمة التنبؤ بسعر الماس: 


from sklearn.ensemble import RandomForestRegressor 
model = RandomForestRegressor(O 
1۱۵061 E ESE FAR, ۷121 ( 


الآن فيما يلي كيفية استخدام نموذج التعلم الآلي الخاص بنا للتنبؤ بسعر الماس: 


1 
نم 


علم البيانات: عن طريق الامثلة 


print (Enter House ۲۵۲۵115 EO 22954016 Ren.) 

)0 522269 دص 42 ) له ملع > 3 

5 = تاتا0ط1) عند‎ ) CUE Type (Ideal: 17 ۳01110۶ 2, 6000: O, ۷ 
COO مك‎ Mel? 5( : WU) 

© < غلاصس ة) و۶10‎ )۲51 26: ON) 

Features < ۵۰3۹3۷7 11۵, ©, CIN) 

print ("Predicted Diamond's Price = ۲, model.predict (features) ( 


Enter House Details to Predict Rent 

Carat Size: 0 

cut Type (Ideal: 1, Premium: 2, Good: 3, Very Good: 4, Fair: 5): 2 
Size: 40 

Predicted Diamond's Price = [937.13946429] 


الملخص 

هذه هي الطريقة التي يمكنك بها استخدام مهاراتكفي علوم البيانات لمهمة تحليل أسعار الماس 
والتنبؤ باستخدام لغة برمجة بايثون. وفقا لتحليل أسعار الماس» يمكننا القول إن سعر وحجم 
الماس المتميز أعلى من أنواع الماس الأخرى. أتمنى أن تكون قد أحببت هذا المقال عن تحليل 
سعر الماس والتنبق به باستخدام بایشون. 


نظام توصيات *۲6]11 باستخدام بایئون 


9 نظام توصيات 66 باستخدام بايثون Netflix‏ 


Recommendation System using Python 

]1 عبارة عن نظام أساسي للبث يعتمد على الاشتراك يسمح للمستخدمين بمشاهدة الأفلام 
والبرامج التلفزيونية بدون إعلانات. أحد آسباب شعبية :)»1< هو نظام التوصية الخاص 
)recommendation systen)‏ بها. يوصي نظام التوصية بالأفلام والبرامج التلفزيونية بناء 
على اهتمام المستخدم. إذا كنت طالبافي علوم البيانات وترغبفي معرفة كيفية إنشاء نظام توصية 
ا8ا فهذه المقالة مناسبة لك. ستأخذك هذه المقالةفي جولة حول كيفية إنشاء نظام توصية 
61[ باستخدام بايثون. 


كيفية عمل نظام توصيات Netflix‏ 
يعرض لك نظام التوصيةني ذا" الأفلام والبرامج التلفزيونية وفقاً لاهتماماتك. «نالاهل 
لديها الكثير من البيانات بسبب قاعدة مستخدميها. يتنبأ نظام التوصية الخاص به بكتالوج 
مخصص لك بناءً على عوامل مثل: 
1. سجل المشاهدة الخاص بك. 
2. محفوظات المشاهدة للمستخدمين الآخرين الذين لديهم أذواق وتفضيلات ممائلة 
لذوقك وتف تفضيلاتك. 
3. الأنواع والفئات والوصف والمزيد من المعلومات حول المحتوى الذي شاهدته‌ني 
الماضي. 
يعد نوع المحتوى أحد أهم العوامل التي تساعد 11641326 على التوصية بمزيد من المحتوى حتى 
للمستخدمين الجدد. آمل أن تكون قد فهمت كيف توصي ×نا؟اه" مستخدميها بالمحتوی. 
يمكنك معرفة المزيد عن ذلك هنا.في القسم آدناه. سوف أطلعك على كيفية إنشاء نظام توصية 
>« باستخدام بايثون. 


نظام توصيات ت01[ باستخدام بایئون 

يتم تنزيل مجموعة البيانات التي أستخدمها لانشاء نظام توصية f>‏ باستخدام بايثون من 
٤ععه.‏ تحتوي مجموعة البيانات على معلومات حول جميع الأفلام والبرامج التلفزيونية على 
ناه[ اعتبارًا من عام 2021. يمكنك تنزيل مجموعة البيانات من هنا. 

دعنا الآن نستورد مكتبات بايثون الضرورية ومجموعة البيانات التى نحتاجها لهذه المهمة: 


311۳9۵0 2107 aS MP 


1 
0 


علم البيانات: عن طريق الامثلة 


1۳0011۲ pandas وه‎ 0 
۴101 51616217 ۰ 6 6 115 el ACEION 1۳0001] ۲ 
۴01 51616211 , 106 211 05 Palit wi 56 موه م1۳‎ SAMI 1 ۷ 


0212 = 0.168۵0 697 ) ۲۴۵۲۴1 1:16 62 سركت‎ 
print (data.head () ) 


show Id Title \ 
6 cc1b6ed9-cf9e-4057-8303-34577fb54477 (Un)well 
1 e2ef4e91-fb25-42ab-b485-bese3b23dedb #Alive 
2 b01b73b7-81f6-47a7-86d8-acb63080d525 #AnneFrank - Parallel stories 
3 b6611af0-f53c-4a08-9ffa-9716dc57eb9c #blackAF 
4 7f2d4170-babs-4d75-adc2-197f7124c07@ #cats_the_mewvie 
Description \ 
@ This docuseries takes a deep dive into the luc... 
1 As a grisly virus rampages a city, a lone man ... 
2 Through her diary, Anne Frank's story is retol... 
3 Kenya Barris and his family navigate relations... 
4 This pawesome documentary explores how our fel... 
Director \ 
6 NaN 
3 cho 1 
2 Sabina ۴۵۵615 ر‎ Anna Migotto 
3 NaN 
4 Michael Margolis 
Genres \ 
8 Reality TV 
1 Horror Movies, International Movies, Thrillers 
2 Documentaries, International Movies 
3 TV comedies 
4 Documentaries, International Movies 
Cast Production Country \ 
e NaN United states 
1 Yoo Ah-in, Park 503۴-۷6 south Korea 
2 Helen Mirren, Gengher Gatti Italy 
3 Kenya Barris, Rashida Jones, Iman Benson, Genn... United States 
4 NaN Canada 
Release Date Rating Duration Imdb Score Content Type Date 0 
6 2020.0 ۲۷-۲۷۸ 1 Season 6.6/10 TV show NaN 
1 2020.0 ۳۷-۷۵ 99 min 6.2/10 Movie September 8, 2020 
2 2619.6 ۲۷-4 95 min 6.4/10 Movie July 1, 2020 
3 2020.0 TV-MA 1 Season 6.6/10 TV Show NaN 
4 2020.0 11-14 96 min 5.1/10 Movie February 5, 2020 


في الانطباعات الأولى على مجموعة البیانات أستطيع أن أرى أن عمود العنوان ( ۲1016" 
محدتنامع) يحتاج إلى إعداد لأنه يحتوي على # قبل اسم الأفلام أو البرامج التلفزيونية. سوف 
أعود الیها.في الوقت الحاليء دعنا نلقي نظرة على ما إذا كانت البيانات تحتوي على قيم خالية أم 


لا: 


1 
1 


نظام توصیات *۲6]11 باستخدام بایئون 


( () ناو . () 15۳1011 . 12 02) ظ 911 


show Id 8 
Title 6 
Description 8 
Director 2064 
Genres 6 
Cast 536 
Production Country 559 


Release Date 


Rating 4 
Duration 

Imdb score 608 
Content Type 6 
Date Added 1335 


dtype: int64 


تحتوي مجموعة البيانات على قيم فارغة. ولكن قبل إزالة القيم الخاليق دعنا نحدد الأعمدة التي 
یمکننا استخدامها لبناء نظام توصية >«0111ع 10: 
data - 0262 ] ] ۳۲۳116۲, ۳1۵50۳3103108۲, 98605626 ۳۱۵۵۲,‏ 


"Genres"] ] 
print (data.head () ) 


Title \ 
6 (Un)well 
1 #Alive 
2 #AnneFrank - Parallel Stories 
3 #blackAF 
4 #cats_the_mewvie 
Description Content Type \ 

@ This docuseries takes a deep dive into the luc... TV Show 
1 As a grisly virus rampages a city, a lone man ... Movie 
2 Through her diary, Anne Frank's story is retol... Movie 
3 Kenya Barris and his family navigate relations... TV Show 
4 This pawesome documentary explores how our fel... Movie 

Genres 
8 Reality ۷ 
1 Horror Movies, International Movies, Thrillers 
2 Documentaries, International Movies 
3 TV comedies 
4 Documentaries, International Movies 


حسب الاسم المقترح: 
1. يحتوي عمود العنوان (صحدتآم 61]16) على عناوين الأفلام والبرامج التلفزيونية على 
.Netflix‏ 
2. يصف عمود الوصف (011115311© صمتاحتن:ع() مخطط العروض التلفزيونية 
والأفلام. 


علم البيانات: عن طريق الامثلة 


يخبرنا عمود (صصتدای )€ontent ype‏ ما إذا كان فيلمًا أم عرضا تلفزيونيًا. 
يحتوي عمود النوع (Genre column)‏ على جمیع آنواع العرض التلفزيوني أو 
الفیلم. 
الآن دعنا نسقط الصفوف التي تحتوي على قيم خالية وننتقل إلى آبعد من ذلك: 
data = 0219 . 0100۳88 )(‏ 
الان سوف أقوم بتنظیف عمود العنوان لأنه يحتوي على بعض إعداد البیانات: 


RU EE‏ افو اراد 

import re 

۲۱121۰ 001/۳۴1080 )۲ 500/0۵105۲ ( 

stemmer = .11م‎ 510172 1 1 56۳۳6 ۲ ("english") 
۶101 EE اطه م1 كنات عدوت‎ 556 PWOE AS 

MP OEE 0 

stopword=set (stopwords.words ('english') ) 


def clean (text) : 


text = str (text) .lower () 

EEE م۲" ۲۶ [2۱ ۲۱۱۰۶ ) طلناو . 2 ع<‎ Ee 

EEE < FE نظ ) نات‎ 2 ۰ // 5 |] O CS Ee) 

كدت E EMO TL,‏ = ارت 

text = re.sub('[%s]' 5 re.escape(string.punctuation), '', 
1 6261 ( 

bext - rE رت ات‎ ۲ ۲, EE) 

اع EE SUC WM Owl, CS‏ = عه 

EE = OE EOE WOO A EEE SOLE FY BE OEE Mol A 
stopword] 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

text=" ". join (text) 


6 تا هط 
data["Title"] = 12102 ] ۲۲116۳۲ [ .apply (clean)‏ 


دعنا الآن نلقی نظرة على بعض عینات العناوین قبل المضی قدمًا: 


911 (daka. 11 Ele. sample )10( ( 


3111 miniforc super dino power 
1822 girl reveng 
516 casino tycoon 
4075 sand castl 
2760 lock 
3406 nightflyer 
536 bangkok love stori object affect 
4365 special 
1733 full 
2343 jeff dunham map 


Name: Title, dtype: object 


الآن سأستخدم عمود الأنواع كميزة للتوصية یمحتوی مشابه للمستخدم. سأستخدم مفهوم تشابه 
جيب التمام (/زتهانحصله عصنومع) هنا (یستخدم للعثور على آوجه التشابهفي مستندين): 


نظام توصيات 1/»)111 باستخدام بايثون 


feature = data["Genres"].tolist )( 

Lfidf = text.TfidfVectorizer (input=feature, 

SEO MORASS ERG LT SRL) 

2510۴ ۵11 = ۶10۴۰ ۶1 1209۶ م‎ 21) ESE UE E) 

811011216 > COSINE 1و‎ 1 211۷ )6۶10۴ 1 


الآن سأقوم بتعيين عمود العنوان کفهرس حتی نتمکن من العثور على محتوی مشابه من خلال 
إعطاء عنوان الفیلم أو العرض التلفزيوني کمدخل: 


و 1۳0626 . 0212) وه 0.5611 = indices‏ 


HCI EE 02 ] ۲۲116 ۲[( CEOS 0۷0۳0110201650‏ 
إليك الان كيفية كتابة دالة للتوصية بالأفلام والبرامج التلفزيونية على 8اه ۳۷: 


def ۵۲۲13126 ۳۵00۳8۲6802161 OR E Ele, 911011 1101و >< اد1ط‎ 1611 YE 

index — 1۳801665 ] 11 16[ 

(SAMI Lar EY] 11061 ((‏ 26 كبرت متف و11 < و0016 51101127117 

۶ و۵۷1 SCOFES,‏ 1171617 1۳01) ۵160و = و0016 5170112۳7111۷7 
reverse=True)‏ , [1] 2 

similarity _ scores = similarity scores[0: 10] 

ایهم ما SILL‏ نت 1 [AIO] FOC‏ = هت 1۱۵۷۵ 

26 EUEN 1212 ] ' 21 61! | ۰ 1106 | MOVA 61 (01 CES [ 


11 ۸۵۲۲ظ)‎ 1312 1656 0 101116 2022 0۳8 EOE E Een رك‎ 


3 blackaf 
285 washington 
417 arrest develop 
434 astronomi club sketch show 
451 aunti donna big ol hous fun 
656 big mouth 
752 bojack horseman 
805 brew brother 
935 champion 
937 chappell show 


Name: Title, dtype: object 


هذه هي الطريقة التي يمكنك بها إنشاء نظام توصيات Netflix‏ باستخدام لغة برمجة بايثون. 


الملخص 

يتنباً نظام التوصية الخاص ب 716411 بكتالوج مخصص لك استنادًا إلى عوامل مثل محفوظات 
العرض الخاصة بك وسجل عرض المستخدمين الآخرين ذوي الأذواق والتفضيلات المماثلة 
والأنواع والفئة والأوصاف والمزيد من المعلومات عن المحتوى الذي شاهدته. آمل أن تكون قد 
أحببت هذه المقالة حول إنشاء نظام توصيات 776113 باستخدام بايثون. 


التنبق بترافيك موقع ويب باستخدام بايثون 


0 التنبؤ بترافيك موقع ويب باستخدام بايثون 
Website ' 12232 Forecasting using Python‏ 


يعني التنبؤ بترافيك موقع الويب (256128ع10756 1۲2116 )Website‏ التنبؤ بترافيك موقع 
الويب خلال فترة معينة. إنها واحدة من أفضل حالات استخدام تنبؤ السلاسل الزمنية ( 11706 
5611659). إذا كنت تريد معرفة كيفية التنبؤ بترافيك موقع ويب. فهذه المقالة 
مناسبة لك.في هذه المقالة» سوف آخذك خلال مهمة التنبؤ بترافيك موقع ويب باستخدام بايثون. 


التنبؤ بترافيك موقع ويب باستخدام بایئون 

يتم جمع مجموعة البيانات التي أستخدمها للتنبؤ بترافيك موقع الويب من بيانات الترافيك اليومية 
لموقع com‏ .everprogrammerاthec.‏ يحتوي على بيانات حول بيانات الترافيك اليومية من 
يونيو 2021 إلى يونيو 2022. يمكنك تنزيل مجموعة البيانات من هنا. لنبدأ الآنفي مهمة التنبو 
بترافيك موقع الويب عن طريق استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


import pandas as pd 

1 وه ۰0۷۵101 ۵101011110 1۳00 

import plotly.express as px 

0و وج واهعه ژطه له د عدن I‏ ۵101۷ 11000 

۴101 52651000615 , Esa. seasonal import Seasonal decompose 
Erom 5265100061 5 . 912۳01831 65 . 252 2165 ]دمص‎ 21557 Back 
from 52651000615 , 282 , 211702 model 17001۲] ARIMA 

import 5۲2۵5100061 و‎ . 291 as sm 


0262 = 0۰1620 CS ) ۲۲۳۵۵1 67 6110100 13211۳16 ES) 
print (data.head () ) 


Date Views 
01/06/2021 7831 
02/06/2021 7798 
03/06/2021 7401 
04/06/2021 7054 
05/06/2021 7973 


© دم بم ين دک 


تحتوي مجموعة البيانات على عمودین؛ التاريخ (ع:12) والترافيك(©67243). قبل المضى قدمّاء 
سأحول عمود التاريخ إلى نوع بيانات التاريخ والوقت: 
م ا ۳۲۲۵۲۵ ] (daa‏ 0816۲1106_ 00.۲0 = [ ۲۲۵۲۵۳۲ ] 021۲2 


۶ 01۳1۵ 1< "50/5۳/5۲۷۲ ( 
911 6 (OEE MES )(( 


O1 
00 


301 
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<class ۳3۳35۰0۳۰۳6۰ ۳36 > 
RangeIndex: 391 entries, ۵ to 08 
Data columns (total 2 columns): 

# Column Non-Null Count Dtype 


@ Date 391 non-null datetime64[ns] 
1 Views 391 non-null int64 

dtypes: datetime64[ns](1), int64(1) 

memory usage: 6.2 KB 


None 


كان عمود التاريخ والوقت كاتتا 0عءزداه)ني البدايةء لذلك قمت بتحويله إلى عمود التاريخ 
والوقت. دعنا الآن نلقى نظرة على الترافيك اليومية لموقع الويب: 


11 ۰51-۷16 ۰1:96 ) ۲۶176۵1۲۳11۷۵1 0111 ( 

( (10 , 15) حه2 ۶1051) هیال ۴1 . 111 

11.101 Galea Dace ll; 0212 ] ۲۷1۵۷75۳۲ ( 

plt.title ("Daily Traffic of Thecleverprogrammer.com"™) 


plt.showO 


Daily Traffic of Thecleverprogrammer.com 


2021-07 2021-09 2021-11 2022-01 2022-03 2022-05 2022-07 


بيانات الترافيك على موقعنا موسمية (لهدهكوء5) لأن الترافيك على الموقع تزداد خلال أيام 
الأسبوع وتنخفض خلال عطلات نهاية الأسبوع. من المفيد معرفة ما إذاكانت مجموعة البيانات 
موسمية أم لا أثناء العمل على مشكلة تنبؤ السلاسل الزمنية. فيما يلي كيف یمکننا إلقاء نظرة على 
ما إذاكانت مجموعة البيانات الخاصة بنا ثابتة (تدطصمتاهه) أو موسمية([56250122): 

۲69111 > Seasonal 0660۳۴0056 (data 0 

1۱0061 < ' 2111111317“ , 

freq = 30) 
۶10 < DIE EIGUES 0( 
۴10 < 11اوط‎ ۰.01 01 )( 
اكات او‎ Size و(عمناد‎ ۵ O) 


التنبق بترافيك موقع ويب باستخدام بايثون 


8 
3 10000 
3 
$ 0 


سأستخدم نموذج ۸11۷/۸ الموسمي (۹۸1۸) للتنبو بالترافيك على موقع الویب. قبل 
استخدام نموذج ۰۹۸13۸ من الضروري إيجاد قیم م و ل و4. یمکنك معرفة كيفية العثور 
على قيم م و4 و و من هنا. 

نظرّا لأن البیانات ليست ثابتة» فإن قيمة ل هي 1. للعثور على قیم م و 4» یمکننا استخدام 
مخططات الارتباط التلقائي )autocorrelation(‏ والارتباط التلقائي الجزئي ( partial‏ 


:(autocorrelation 


0۰1 0111۳0 ۰210106011618631 08 010 )0212 1] Ui ews ll) 
1.00 
75 
0.50 
0.25 
0.00 


025 


Autocorrelation 


-0.50 

-5 

0 50 100 150 200 250 300 350 
lag 


910 مهت‎ (OEE [VES , 1295 5> 100( 
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Partial Autocorrelation 
1.0 


0.8 


0 20 40 60 80 100 


الآن إليك كيف يمكننا تدريب نموذج 54۸1۸14 لمهمة التنبؤ بترافيك موقع الويب: 


2 ,5 - و ,4 ,م 


model=sm.tsa.statespace.SARIMAX (data ] 'Views”], 
order=(p, d, 4Q), 
5909 Cede (I, رال رت بك‎ 
model=model.fit(0 
print (model .summary () ) 


Statespace Model Results 


Dep. Variable Views No. Observations: 391 

Model: SARIMAX(5, 1, 2)x(5, 1, 2, 12) Log Likelihood -3099 . 42 

Date: Tue, 28 Jun 2022 AIC 6228.803 

Time: 07:01:10 BIC 6287.827 

Sample: 6© HQIC 6252.229 
- 1 

Covariance Type: 3 


ma.S.L24 -0.04 3.637 -.27 0.978 -7.28 7.029 
sigma2 1.25746 5+ع1.59‎ 7.14 6,666 9.46e+05 1.57e+66 
Ljung-Box (Q): 102.98 Jarque-Bera (38): 1.32 
Prob(Q) : 6.668 Prob(38): 0.52 
Heteroskedasticity (H): 1.03 Skew: 0.14 
Prob(H) (two-sided): 0.85 Kurtosis: 3.01 


دعنا الآن نتنبأ بترافيك موقع الويب خلال الخمسين یوم القادمة: 


التنبق بترافيك موقع ويب باستخدام بايثون 


predictions = model.predict (len (data), len (data) +50) 
911 2116 ) 6ك لل كت ره‎ 2955 


391 9874.390136 
392 10786.957398 
393 10757.445305 
394 9863.890552 
395 8765.031698 
396 8212.3161 
397 8929.181869 
398 9685.809771 
399 10270.622236 
469 10625.904093 
461 9854.870630 
402 9362.193417 
403 9040.021193 
404 9081.558484 
405 10538.993124 
406 11003.816870 
407 10897.859601 
408 16683 . 4 
469 9445.806523 
410 8629.901288 
411 9184.420361 
412 10392.770399 
413 10593.941868 
414 10788.128238 
415 10263.181427 
416 9449.467789 
417 940,13 
418 9168.9721 
419 9887.094079 
420 10218.658067 
421 10715.657122 
422 9899.224399 


423 9541.622897 
424 9665 . 1 
425 8825.335634 
426 10137 2 
427 10839.866240 
428 10905.862922 
429 10411.640309 
430 9451.211368 
431 8698.339931 
432 8725.534103 
433 10060.678587 
434 10506.263524 
435 10842.515622 
436 10485.387495 
437 9335 . 3 
438 9175.122336 
439 9357.034382 
440 10295.910655 
441 11162.947 
dtype: float64 


data["Views"] .plot (legend=True, label="Training Data”, 


2205126-15, 10(( 
predictions.plot (legend=True, label="Predictions") 
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الملخص 

إذن هذه هي الطريقة التي يمكنك بها التنبؤ بترافيك موقع الويب لفترة معينة. يعد التنبؤ بترافيك 
موقع الويب أحد أفضل أفكار مشروع علم البيانات التي يمكنك ذكرهاني سيرتك الذاتية. آمل أن 
يكون هذا المقال مفیدا لك لتعلم التنبؤ بترافيك موقع الويب باستخدام لغة برمجة بايثون. 


نظام توصية المطاعم تخد بو 


1 نظام توصية المطاعم باستخدام بایئلون 
Restaurant Recommendation System using‏ 


Python 
أحد التطبيقات الشائعة لعلم البيانات. نظام‎ )recom mend يعد نظام التوصية (دطع]59:5 صمتاج‎ 
هو أحد التطبيقات التي توصي‎ )اestaurant‎ recommendation system) توصية المطاعم‎ 
بمطاعم مماثلة للعميل وفقًا لذوق العميل. إذا كنت تريد معرفة كيفية إنشاء نظام توصية مطعم.‎ 
فهذه المقالة مناسبة لك. ستأخذك هذه المقالةفي جولة حول كيفية إنشاء نظام توصية مطعم‎ 

باستخدام بايثون. 


نظام توصية المطاعم باستخدام بایئون 

نظام توصية المطاعم هو أحد التطبيقات التي توصي بمطاعم مماثلة للعميل وفقاً لذوق العميل. 
لبناء نظام توصية مطعم باستخدام بايثون. قمت بجمع البيانات من عاع128. يمكنك تنزيل 
مجموعة البيا نات لهذه المهمة من هنا. 


دعنا الآن نستورد مكتبات بايثون الضرورية ومجموعة البيانات التى نحتاجها لهذه المهمة: 


import numpy as np 
1۳0011۲ 52202025 وه‎ 0 
from sklearn. featur EE 2610522 AMEE E Hex 


E OM 5161681 Me 11 05 , 02117101 Se 1۳۵۲] COSINE 1104 1 EY 


0312 > 
0۰ read 697 )۳۲ ۲۴1۴۵2۸03 SOE  ظعو‎ ] و روناج‎ 2166 010۳86۴0 6101۰. CSV) 
print )02 12 ۰.1620 )( ( 


Name Street Address \ 
6 Betty Lou's Seafood and Grill 318 Columbus Ave 
1 Coach House Diner 55 State Rt 4 
2 Table Talk Diner 2521 South Rd Ste C 
3 Sixty Vines 3701 Dallas Pkuy 
4 The Clam Bar 3914 Brewerton Rd 
Location Type \ 
@ San Francisco, CA 94133-3908 Seafood, Vegetarian Friendly, Vegan Options 
1 Hackensack, NJ 07601-6337 Diner, American, Vegetarian Friendly 
2 Poughkeepsie, NY 12601-5476 American, Diner, Vegetarian Friendly 
3 Plano, TX 75093-7777 American, Wine Bar, Vegetarian Friendly 
4 Syracuse, NY 13212 American, Bar, Seafood 


Reviews No of Reviews \ 
6 4.5 of 5 bubbles 243 reviews 
1 4 of 5 bubbles 84 reviews 
2 4 of 5 bubbles 256 reviews 
3 4.5 of 5 bubbles 235 reviews 
4 4 of 5 bubbles 285 reviews 


65 علم البیانات: عن طريق الامنلة‎ 
Comments Contact Number ١ 
8 NaN +1 415-757-0569 
1 Both times we were there very late, after 11 P... +1 201-488-4999 
2 Waitress was very friendly but a little pricey... +1 845-849-2839 
3 Not sure why I went there for the second time.... +1 469-620-8463 
4 Doesn't look like much from the outside but wa... +1 315-458-1662 
Trip_advisor ۳1 \ 
6 https://wuw.tripadvisor.com//Restaurant_Review. .. 
1 https://wuw.tripadvisor .com/ /Restaurant_Review. .. 
2 https://wuw.tripadvisor .com//Restaurant_Review. . . 
3 https://wuw.tripadvisor .com//Restaurant_Review. . . 
4 https://wuw.tripadvisor .com//Restaurant_Review. . . 
Menu Price_Range 
6 Check The Website for a Menu 55 - 5 
1 Check The Website for a Menu 55 - 5 
2 http://tabletalkdiner.com/menu/breakfast/ $$ - 55 
3 دمغ خا‎ : //sixtyvines .com/menu/plano-tx/ 55 - 5 
4 Check The Website for a Menu 55 - 55 


سأحدد عمودين من مجموعة البيانات لبقية المهمة (الاسم (6آ) والنوع (©م157)): 


data = data ] ["Name", "Type"] [ 
print (data.head () ) 


Name Type 
6 Betty Lou's Seafood and 66111 Seafood, Vegetarian Friendly, Vegan Options 
1 Coach House Diner Diner, American, Vegetarian Friendly 
2 Table Talk Diner American, Diner, Vegetarian Friendly 
3 Sixty Vines American, Wine Bar, Vegetarian Friendly 
4 The Clam Bar American, Bar, Seafood 


قبل المضي قدمًاء دعنا نلقي نظرة على ما إذا كانت البيانات تحتوي على أي قيم فارغة أم لا: 


00ت () نورد واحعاعای)) E‏ شم 


Name 8 
Type 13 
dtype: 64 


لذلك تحتوي البیانات على بعض القیم الخاليةني عمود النوع. سأحذف الصفوف التي تحتوي 
على قیم فارغة قبل المضي قدمًا: 

data = data.dropna() 
يعد نوع المطعم ميزة قيمةفي البيانات لبناء نظام توصية. يمثل عمود النوع هنا فئة المطاعم. على‎ 
سبيل المثال. إذا كان العميل يحب المطاعم الصديقة للنباتيين» فسوف ينظر فقط إلى التوصيات‎ 
إذا كانت صديقة للنباتيين أيضًا. لذلك سأستخدم عمود النوع كميزة للتوصية بمطاعم ممائلة‎ 
للعميل:‎ 


feature = 0432 ] ۲۲۳۷/۵۵۳۲ [ (1150ه6.‎ 


Lfidf = text.TfidfVectorizer (input=feature, 

5۱0_۲۷701092 "6۳89131 5۳"( 

۲۶1 0 ECL = CENE ELE ۲128۸5۶01۳ (ESE) 

81101121 وت‎ = COSTS 12ل 512 ) 21517 22 ادويق‎ MEE E) 


5 نظام توصية المطاعم باستخدام باون 
الآن سأقوم بتعيين اسم المطعم کفهرس حتی نتمکن من العثور على مطاعم مماثلة من خلال 
إعطاء اسم المطعم کمدخل: 


indices = pd.Series (data.index, 
1۱06:6202 ] ۲۸۲276 ۲ |) . 000 002135250 


الآن إليك كيفية كتابة دالة للتوصية بمطاعم ممائلة: 


def 69 ۵12 6 _ 66016 02 EON (name, SIMI lA EY < SIMI LAE EE 


index = indices [name] 

(( 11061 ] 1۷ج 1 (SIMI‏ 182153 6ناطه) و11 = SEOEeS‏ 5170112711۷7 

و هل 9 بر SCORES,‏ اه 1و میا هو = هه 511۲۱۱۱۵۴ 
reverse=True)‏ , [1] 2 

similarity _ scores = similarity _ scores[0 : 10] 

EEE WE EM 224 = AION EOE 1 i ۳۱۳ ماو‎ COLES] 


Qata ] ۲۸۲2۵۳۲6 ۲[ ۰.1106 ] ۲65 2 12 20 631 ۱01 665 [‏ طصتا تاه ۲ 


(( 061111 ۲16۵۲ ۲۳/۵۸) طه 08121 ۲۳660188 _ السك نا BERE (EES‏ 


23 The Lion's Share 
154 Houlihan's 
518 Midgley's Public House 
568 Aspen Creek Grill 
770 Pete's Sunset Grille 
1156 Paul Martin's American 71 
1581 Aviation Grill 
1872 Aviation Grill 
2193 Crest Bar & Grill 


2612 Tahoe Joe's Famous Steakhouse 
Name: Name, dtype: object 


الملخص 

هذه هي كيفية بناء نظام التوصية بالمطعم باستخدام لغة برمجة بايثون. نظام التوصية بالمطعم هو 
تطبيق يوصي بمطاعم مماثلة للعميل وفقا لذوق العميل. آمل أن تكون قد أحببت هذه المقالة 
حول بناء نظام التوصية بالمطعم باستخدام بايثون. 


تحليل أداء اللاعب :160۳1 ۷۳26 باستخدام بايثون 


2 تحليل أداء اللاعب نخلطهع1 غدهذ7؟ باستخدام بايثون 
Virat Kohli Performance Analysis using Python‏ 


يعد تحليل أداء اللاعب (0671010121066 ayersام)‏ إحدى حالات استخدام علوم البياناتفي 
التحليلات الرياضية (2021171169 50015). يعتبر فيرات كوهلي )Virat Koh)‏ أحد أشهر 
لاعبي الكريكيتفي العالم. لذلك سيكون مشروع علم بيانات رائعًا إذا قمنا بتحليل أداء الضرب 
ل 160 Vit‏ على مر السنين. لذلك إذا كنت تريد معرفة كيفية تحليل أداء Kohli‏ ۰۷726 
فهذه المقالة مناسبة لك.في هذه المقالق سوف آخذك خلال مهمة تحليل آداء Virat Kohli‏ 
باستخدام بايثون. 


تحليل أداء ت10 ۷1۳26 (دراسة حالة) 
يعتبر 120111 ۷1۲۸6 أحد آشهر لاعبي الكريكيتفي العالم. هنا تحصل على مجموعة بيانات 
لجميع مباريات 0101 التي لعبها نلدم1 غ171 من 18 أغسطس 2008 إلى 22 يناير 2017. 
أنت مطالب بتحليل أداء نلطم>1 ۷1726 نی مباريات 101[©. 


فيما يلي المعلومات الكاملة حول جميع الأعمدةفي مجموعة البيانات: 


.1 


2 


3 


.8 


9 


ئ : النقاطني المباراة. 
۳ الكرات التى تواجههاني المباراة. 
5 عدد و4ني المباراة. 


»ئ عدد و6ني المباراة. 


. *51: معدل الضرباتفي المباراة. 


۳05 : مركز الضرب في المياراة. 
:Dismissa1‏ كيف خرج Kohli‏ 1۳26 ۷ ف المباراة. 
عصصا: الشوط الأول والثاني. 


2 من کان خصم الهند. 


:Ground . 0‏ مكان المباراة. 


Date .11‏ ته9: تاريخ المباراة. 


KE‏ علم البيانات: عن طريق الامثلة 


يمكنك تنزيل مجموعة البيانات هذه من هنا. 


تحليل أداء تلطه ]آ ۷1۳26 باستخدام بايثون 
لنبدأ الآن بمهمة تحليل أداء 16011 ۷2۵6 باستخدام بايثون. سأبدأ هذه المهمة عن طريق استيراد 
import pandas as pd‏ 
و NUNSY aS‏ 1۳00 


1۳0011 0101۷ ۰. ۵201۵98 وج‎ P< 
1100021 1011۷ وج واه ژطه الام دصو‎ 0 


dala < PA ead CSV ۳۷9 KORE ES) 
print (data.head() ( 


Runs BF 4s 6s SR Pos Dismissal Inns Opposition Ground \ 

8 22 هه‎ 1 @ 54.54 6 lbw 1 v Sri Lanka Dambulla 
1 327 6 529 99:22 89 caught 2 v Sri Lanka Dambulla 
2 25 38 4 @ 65.78 1.6 run out 1 v Sri Lanka Colombo (RPS) 
3 54 66 7 6 81.81 6 bowled 1 v Sri Lanka Colombo (RPS) 
3 31 46 3 1 67.39 1.0 1bw 2 v Sri Lanka Colombo (RPS) 

Start Date 
6 18-Aug-08 
1 20-Aug-08 
2 24-Aug-08 
3 27-Aug-08 
4 29-Aug-08 


دعنا نلقى نظرة على ما إذا كانت مجموعة البيانات هذه تحتوي على أي قيم فارغة أم لا قبل 
المضى قدما: 
(OEE ۰. 19۳81011 )( . 5۱5 )( (‏ 11 


Runs 


Dismissal 
Inns 
Opposition 


8 

8 

8 

8 

8 

Pos 8 
8 

8 

8 

Ground 8 
8 


Start Date 
dtype: int64 


تحتوي مجموعة البيانات على المباريات التي لعبها 10111 171126 بين 18 أغسطس 2008 و 
2 يناير 2017. لذلك دعونا نلقي نظرة على إجمالي النقاط التي سجلها ٥11:‏ غ171:2: 


#Total Runs Between 18-Aug-08 - 22-Jan-17 


08212 ] RUNS [ SUMO 


تحليل أداء اللاعب 160۳11 İt‏ باستخدام بايثون 69 
6184 


الآن دعونا نلقى نظرة على متوسط نقاط 1501111 ۷۵6 خلال نفس الفترة: 
#Average Runs Between 18-Aug-08 - 22-Jan-17‏ 


data ["Runs"] .mean( 


46.84848484848485 


في ۰00015 يعتبر متوسط الضرب من 37-35 متوسطًا جیدا. لذا فان معدل الضربفي 771:2 
10111 جيد. الآن دعونا نلقي نظرة على اتجاه الجري الذي سجله 10111 ۷۱۲۵6 يني مسيرته 
من 18 أغسطس 2008 إلى 22 يناير 2017: 


matches = 0233 . 1220© 
figure = .عام‎ 13106 (data, x=matches, y="Runs”, 
title='Runs Scored by Virat Kohli Between 18-Aug-08 - 
22 VARI) 
figure. 59070 


Runs Scored by Virat Kohli Between 18-Aug-08 - 22-Jan-17 


150 


100 


RUNS 


0 20 40 60 80 100 120 


index 


في العديد من الاشواط التي لعبها Virat Kohli‏ « سجل أكثر من 0 نقطة أو ما يقرب من 
ذلك. هذه علامة جيدة على الثبات. الآن دعونا نرى جميع مواقع الضرب (05161055م (batting‏ 


: ۷1۲۵۲ Kohli التي لعبها‎ 
#Batting Positions 
EEA امس‎ = COCA YEO تا اه ار ها‎ AE Sy AUS 
WEEE MG AE AF, 2.05 BEEING AE 2 
نارازه و‎ A LA, ۰0۰ ات تاد ای‎ AE و‎ 
۱۱۵ اه‎ AE 5 
۳:60 21196 AC GA!) 


EOS [| value 60۱860‏ ] 0212 < و۴ 
label = Pos.index‏ 
counts = Pos.values‏ 


علم البيانات: عن طريقالامثلة 


,16۵116۲ 0ك م۵16۲ ,۲110۳0۵۵8۲ ,۲9۵10۲] < هه 
"orange"]‏ ا 


fig = go.Figure (data= [go.Pie(labels=label, values=counts) [( 
فط‎ . ۵021۲6 1210۱۲ )2 1 Ele Eee NUNOeE Of 212662265 ۸۲ ۲1۶۶6۵۲ 
BAERS 255162225 ( 
۶۴1 . 1002۲6 2665 (MOMer Imi O 1206141061660۲ ۵۲10۴0۲ ۷۵116 م‎ 
lex ONE 51 26-30, 

112 ۲ 1612031 اه‎ )6۵1 0192001018, 1316201 0۲ )6۵10122 ۲10120161 
width=3) ( ) 
۶1 0 . 51070 


Number of Matches At Different Batting Positions 


Batting At 3 
Batting At 4 
Batting At 7 
Batting At 2 
Batting At 1 
Batting At 5 
batting At 6 


في أكثر من 68./ من جميع الاشواط التي لعبها ن1٣‏ ۷12۵6 ۰ احتل المركز الثالث. الآن دعونا 
نلقي نظرة على مجموع النقاط (15125 60]21) التي سجلها 1501111 ۷1۲4۲ في مراكز مختلفة: 


label < 0218 128 [ 

6025-5 > 0212 ] RUNS | 

ل DAN, DILE,‏ روا ۰ ر هرود از = COLORS‏ 
"orange" ]‏ ا 


fig = go.Figure (data= [go.Pie (labels=label, values=counts) [( 

۶۴1 . ۵02۲6 1310۱ )1۳۲16 Eex t> ROMS Ev ۷12۵ KORT AE 1۴۶۶۵۲۲ 
Bat 11۳9 091ظ‎ 110۳89 ( 

1 عستت لل ۱9۵65 1۳021 . ل‎ IME O ۱66۲ 6۱, ادها‎ ME OS VALUE LF 
lexi ONE جع ات‎ 0U 


marker=dict (colors=colors, line=dict (color='black'", 
width=3) ) ) 
۶1 0 . 51070 


Runs By ۷۱۲۵۴ Kohli At Different Batting Positions 


Batting At 3 
Batting At 4 
Batting At 5 
Batting At 1 
Batting At 2 
Batting At 7 
batting At 6 


تحلیل آداء اللاعب 101۳11 ۷۲۵۲ باستخدام بایئون 71 


آکثر من 72/ من مجموع النقاط التي سجلها ناه ۷:۵6 هيني المرکز الثالث. لذلك یمکننا 
القول أن الضربفي المرکز الثالث مثالي لنلطه؟] ۷1۳26 . 


الآن دعونا نلقي نظرة على عدد القرون 662165 (100 نقطةفي شوط واحد) التي سجلها 
خلاه>] Vit‏ أثناء الضربفي الاشواط الأولى والثانية: 


centuries = data.query ("Runs << 100") 
figure = px.bar (centuries, x=centuries["Inns"], ۷ = 
centuries ["Runs”] 


5 
color = centuries ] "1125" [, 


۰ 11۳1105 1ت 82 BY 21226 KONI IM‏ 021955 15م 5-8 عالدنا 
Second Innings”)‏ 


figure. 99070 


Centuries By Virat Kohli in First Innings Vs. Second Innings 


Runs 


1500 


1000 


Runs 


1.5 2.5 


Inns 
لذلك يتم تسجيل معظم القرون أثناء الضربفي الادوار الثانية. من خلال هذاء يمكننا القول إن‎ 
يحب مطاردة النتائج. دعنا الآن نلقي نظرة على نوع عمليات الطرد (52[5كتدط035)‎ Via لامک‎ 
التي واجهها 1اه في معظم الأوقات:‎ 


OE ۷122۲ 1‏ و1ووو له #01 


0191۳01 921و‎ = daca ۲۲19۳1 9821 "| value COUR 50) 

label = 0415215531 . 1 6*6 

counts = 0152115 5315 

661425 < ]۲9۵10۲, ۲110۳01۵۵18۲, DER, DELEL, ۲16۵11۵۲, 
"ayan, ۲۵2006۷ [ 


(data= [go.Pie(labels=label, values=counts) [(‏ 09۲6 1 . 0و = fig‏ 
1م ات عدن OE‏ 15ت 8151052-55 ' (tille text=‏ 02 76 22 1002۲6 . ۴10 
م ۵10۶02۲۷۵1106۲ ,1۵۳6110۵10۵0۲ 12-17 اه 2ق 1م01 و۲۵6۵ ۵0266 د ۶1 
EEE EOE 52-0‏ 

marker=dict (colors=colors, line=dict (color='black'", 
width=3) ) ( 
۶10 . 51070 


علم البيانات: عن طريق الامثلة 
Dismissals of Virat Kohli‏ 


caught 
not out 
bowled 
run out 
lbw 
stumped 
hit wicket 


هه داهس مضه 


1 
1 


لذلك‌ني معظم الأوقات. يخرج 120111 ۷1۲۸6 من خلال القبض عليه من قبل اللاعب أو 

الحارس. الآن دعونا نلقي نظرة على الفريق الذي سجل 120111 ۷1۲۵6 معظم نقاطه: 
ll, 7۷ dalal LENS I,‏ لدت ع1 عه مم6 ] 20212 Oar (dala,‏ عدم - 126 حلص 
را 3 Cols > daa‏ 


title="Most Runs Against Teams”) 
figure. show() 


Most Runs Against Teams 
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حم 
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وفقا للرقم اعلا يحب Virat Kohli‏ اللعب ضد سریلانکا وأستراليا ونيوزيلندا وجزر الهند 
الغربية وإنجلترا. لكنه سجل معظم أشواطه أثناء لعبه ضد سريلانكا. دعونا الآن نلقي نظرة على 
الفريق الذي سجل ضده Virat Kohli‏ معظم قرونه: 


figure = px.bar (centuries, x=centuries ["Opposition"], مز‎ = 
66۳۴1011 م ۲۹۵۵ ] وه‎ 


CRUST.‏ ] وه د1طنااطوم ح كترم طروت 
title="Most Centuries Against Teams”)‏ 
figure. show()‏ 


تحليل أداء اللاعب :1601 ۷:۵6 باستخدام بايثون 


ل- 
2 


Most Centuries Against Teams 


Runs 


130 
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Opposition 
لذلك. كانت معظم القرون التي سجلها 10111 ۷۲۵6 ضد أستراليا. الآن دعونا نحلل معدل‎ 
ضربات 160131 ۰۷12۵6 لتحليل معدل ضربات 1501211 171126 ۰ سأقوم بإنشاء مجموعة بيانات‎ 
:120 جديدة لجميع المباريات التي لعبها 10111 ۷1:۵6 حيث كان معدل تسديده أكثر من‎ 


O)‏ د< لدت ) .تاو > Fale‏ تاد 
اا DERE KSEE Ee‏ 


2 
3 
ر‎ 
۷" 
0 
n 
د‎ 
3 
o 
u 


SR Pos Dismissal Inns Opposition \ 
142.10 Batting At 7 bowled 
120.48 Batting At 4 
209.09 batting At 6 
126.47 Batting At 3 caught 
122.89 Batting At 3 caught 

3 
3 
3 
3 


v Sri Lanka 
not out v Bangladesh 
not out ۷ West Indies 

v England 
۷ West Indies 
192.30 Batting At not out v Australia 
174.24 Batting At 
120.00 Batting At 


160.00 Batting At 


not out v Australia 


caught v New Zealand 


ب 
o‏ 
۳ 
نا 
N‏ 
o‏ 
w‏ 
در 
سا 
© دم © در ی ی شرا بم © 
عم م دم فو كو يم يم نو امو 


caught v England 


Ground Start Date 


8 Rajkot 15-Dec-09 
32 Dhaka 19-Feb-11 
56 Indore 8-Dec-11 
76 Birmingham 23-Jun-13 
78 Port of Spain 5-Ju1-13 
83 Jaipur 16-Oct-13 
85 Nagpur 30-Oct-13 
93 Hamilton 22-Jan-14 
136 Cuttack 19-Jan-17 


الآن دعونا نرى ما إذا كان ناه ۷/1۲۵6 يلعب بمعدلات ضربات عاليةني الاشواط الأولى أو 
الاشواط الثانية: 


۳ هلان‎ PX Dor تاو‎ 116 Fale, x = تاد‎ KE Ae سم‎ 
۱7 = SEEKS EEE و ات‎ 
COMO 5 مداه‎ O SSN, 


Ile Vira KONI 5 11 وه‌اهط 116 رات طو‎ In EITSE 1 
VS. 566240 2222955 


علم البيانات: عن طريق الامثلة 
figure. 520170(‏ 


Virat Kohli's High Strike Rates in First Innings Vs. Second Innings 


SR 
4 
n 
400 160 
200 140 
120 
0 
5 1 15 2 25 


Inns 


لذلك وفقا للشكل أعلاه. يحب ناطهK‏ 17126 اللعب بقوة أكبرفي الاشواط الأولى مقارنة 
بالاشواط الثانية. الآن دعونا نرى العلاقة بين الأشواط التي سجلها 1601 171:2 والأربع 
(401315) التى لعبهافي كل شوط: 
figure = px.scatter (data _ frame = data, x="Runs,"‏ 
EERE oS‏ روا لصو بو e O‏ 


title="Relationship Between Runs Scored and Fours”) 
figure. showO 


Relationship Between Runs Scored and Fours 


45 


Runs 


هناك علاقة خطية. هذا یعنی أن 16011 ۷۱۲۵۲ يحب اللعب الرياعى. كلما زاد عدد مرات الجري 
التي سجلهاني الآدوارء كلما لعب رباعيات أكثر. دعونا نرى ما إذا كانت هناك علاقة ما مع 
السداسيات (51©5): 
figure = px.scatter (data frame = data, x="Runs,"‏ 
e oS‏ آناممععی روا VE OS GSE‏ 


title= "Relationship Between Runs Scored and Sixes”) 
figure. showO 


تحليل أداء اللاعب 12011 Virat‏ باستخدام بایئون 


- 
1 


Relationship Between Runs Scored and Sixes 


6s 


©« © ۰660 © ® 
0 10 ODO) 0 
0 50 100 150 
Runs 


لا توجد علاقة خطية قوية هنا. هذا يعني أن 16011 171:2 يحب لعب رباعايات أكثر من 
سداسيات. هذه هي الطريقة التي يمكنك بها تحليل أداء ناطهK‏ 17126 أو أي لاعب كريكيت 
آخرني العالم. 

الملخص 

هذه هي الطريقة التي يمكنك بها إجراء تحليل أداء 1[اه؟]1 ۷1۲۸6 باستخدام لغة برمجة بايثون. 
يعد تحليل أداء اللاعب إحدى حالات استخدام علم البياناتفي التحليلات الرياضية. آمل أن 
تكون قد أحببت هذه المقالة حول تحليل آداء ذ1601«1 ۷226 باستخدام بايثون. 


نظام توصية الكتب باستخدام بايثون 6 


- 


3 نظام توصية الكتب باسنخدام بایئون 00 


Recommendation System using Python 
أحد التطبيقات الشائعة لعلم البيانات. نظام‎ )recommendation syste) يعد نظام التوصية‎ 
هو تطبيق يستخدم للتوصية بالكتب‎ )800k Recomm توصية الكتب (557566112 صمتامصع‎ 
الممائلة للمستخدم. إذا کشا تريد معرفة كيفية إنشاء نظام توصية للکتب. فهذه المقالة مناسية‎ 

لك. ستأخذك هذه المقالةفي جولة حول كيفية إنشاء نظام توصية للکتب باستخدام بایشون. 


نظام توصية الکتب باستخدام بایئون 

يجب أن يوصي نظام التوصية الکتب بالکتب الممائلة بناءٌ على اهتمام المستخدم. يتم جمع 
مجموعة البیانات اللازمة لبناء نظام توصية الکتاب من ©152881. يمكنك تنزیل مجموعة البیانات 
من هك 


دعنا الآن نستورد مكتبات بايثون الضرورية ومجموعة البيانات التى نحتاجها لهذه المهمة: 


import numpy as np 

0 وه 5222025 1۳0011۲ 

اجه 110001۲ طم 01و مره CUES‏ 63 516168110۰ ۴1۲010 

E FOM 9161681۳ , 106 13 وم‎ , Pai EWIN 56 هم( 11 دن‎ 1 


02162 = 0۰1620 697 )۲۵۵۵16 CECA. CSN) 
print (data.head () ) 


book_authors ... image_url 
إن‎ Suzanne Collins ... https://images.gr-assets.com/books/14473036031... 
1 3.K. Rowling|Mary GrandPré ... https://images.gr-assets.com/books/12556149701. . . 
2 Harper Lee ... https://images.gr-assets.com/books/13619756801. .. 
3 Jane Austen|Anna Quindlen|mrs. Oliphant |George... ... https://images.gr-assets.com/books/13203993511. .. 
4 Stephenie Meyer ... https://images.gr-assets.com/books/13610394431. . . 


[5 rows x 12 columns] 
«book desc «book title) سأختار ثلاثة أعمدة من مجموعة البيانات لبقية المهمة‎ 


:(book rating count 


OOO eS, OOS FOES COU I‏ ارت COR‏ ا daca‏ > اوه 
print (data.head() )‏ 


book_title ... book_rating_count 
e The Hunger Games ... 5519135 
1 Harry Potter and the Order of the Phoenix ... 20941594 
2 To Kill a Mockingbird ... 3745197 
3 Pride and Prejudice ... 2453620 
4 Twilight ... 4281268 


[5 rows x 3 columns] 


عله یت عن طريق ی 


دعنا نلقي نظرة على أفضل 5 كتبفي مجموعة البيانات وفقاً لعدد التقييمات: 


02162 > dala 50۳1 721165 )<۲0016 ACERS _ 
ascending=False) 


۲00 5 = data 222340 


import plotly.express as px 
1100021 1011۷ EAP 0و وج 625ص ژطه‎ 


labels EOD 9] 6560312 EE [ 
values 200 S| ۲۵۵۵1۲6۵1۳00 COUR | 
61525 < ] ۲9۵10۲ , "2625052 ف‎ [ 


fig = go.Figure (data= [go.Pie(labels=labels, values=values) [( 
HE 115215 9 عاتاه‎ CE تراسا که‎ 5 SEEN EOS) 
فط‎ . ۵02۲6 2065 (ROME 10۶02۲ 1206110, 
تا که تا‎ 11 O ۵۳ ادها | لام‎ ONE 1و‎ 26, 

112 2 اه 2-01 عع‎ (colors=colors, 1316201 0۲ (color='black'", 
width=3) ) ) 
۶1 0 . 5۳070 


Top 5 Rated Books 


Harry Potter and the Sorcerer's Stone 
Los juegos del hambre 

Bado 2۵10۷۵۶ 

80 اعم‎ oyunlan 

5 Hunger Games 


قبل المضي قدمّاء دعنا نتحقق مما إذا كانت البيانات تحتوي على قيم خالية أم لا: 
SEMO)‏ () 15۳1011 . 12 02) ظ 911 


8 عاممط 
book_desc 1331‏ 
book_rating_count 8‏ 


dtype: 21564‏ 
تحتوي مجموعة البيانات على قيم خاليةفي عمود وصف الكتاب ( book description‏ 
دعنا نسقط الصفوف التي تحتوي على قيم خالية: 


data = data.dropna() 
سأستخدم الآن عمود وصف الكتاب كميزة للتوصية بالكتب المماثلة للمستخدم:‎ 


نظام توصية الكتب باستخدام بايثون 


۳ وم‎ EUEe > هه واه‎ dese EOL SEU 

Lfidf = text.TfidfVectorizer (input=feature, 
5۱0_۲۷701092 lengli SRL) 

EE LOE 202162 12264 ۶10۶ EI 128۸9۶01۳ )۶6۵۱۲6( 

5111۱3۴ EY < کل نا ) ۳۱۵ و1116‎ MACE حلل دعتار‎ MICE) 


الآن سأقوم بتعیین عمود عنوان الکتاب (0111122» 1106 0016) کفهرس حتی نتمکن من العثور 


indices = pd.Series (data.index, 
1 02حعر06ظ‎ 22 ] ۲0016 ۲1116 lJ . و0‎ _ 00۳0131021۲690 
الآن اليك كيفية كتابة دالة للتوصية بکتب ممائلة:‎ 


:5110111111۷ > ۷7 1711 110و ,1۳۲16) 02110 صعصطهع6ع_ 001 def‏ 


[11116] وم 1301 < 106 1 

5110112۳711۷7 5 دن‎ 25 < MiSs lenUME 26 (SEMA 1 1ج‎ 2۷ ] 100661 (( 

5110112۳711۷7 800168 = ۵160و‎ )1۳01 171 617 60165 , 1۵1۷1۳42 ۶ 
2 ]1 [ , reverse=True) 

similarity scores = similarity scores|[0: 5| 

ool: ees > [ION EO 1 IM SII IE SOO 

Ee WEN dalal BOOK Eee [ ۰ 1۱ نو عن‎ ۱0 Ee SI 


11 ظ0 21 6۵6018۳86۴02 _>001ظ)‎ )۲16 ۲۲615 EO 2 6016۲ EOUSE LD) 


21823 The Kabbalah of Jesus Christ, Part 1 The True ... 


28960 Seeing and Savoring Jesus Christ 
17173 Jesus and Moses in India 
7944 The Jesus I Never Knew 


16976 Beautiful Outlaw: Experiencing the Playful, Di... 
Name: book_title, dtype: object 


الملخص 

يجب أن يوصي نظام التوصية بالكتب المماثلة وفقا لمصلحة المستخدم. كمبتدئني علم البیانات 
يجب أن تعمل بشكل جيدفي مشروع علم البيانات هذا للتعرف على أنظمة التوصية. يمكنك 
العثور على المزيد من مشاريع علوم البيانات للتدرب عليها من هنا. أتمنى أن تكون قد آحببت 
هذه المقالة حول كيفية بناء نظام توصية كتاب باستخدام بايثون. 
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4 تحلیل بیانات الساعات الذكية باستخدام بایئون 
Smartwatch Data Analysis using Python‏ 


هناك الكثير من المنافسة بين العلامات التجاريةفي صناعة الساعات الذكية (1 W2‏ 204۲). 
الساعات الذكية مفضلة من قبل الأشخاص الذين يرغبونفي رعاية لياقتهم البدنية. يعد تحليل 
البيانات التي تم جمعها عن لياقتك إحدى حالات استخدام علم البياناتفي الرعاية الصحية. 
لذلك إذا كنت تريد معرفة كيفية تحليل بيانات اللياقة للساعة الذكيةء فهذه المقالة مناسبة لك.في 
هذه المقالة» سوف آخذك خلال مهمة تحليل بيانات الساعة الذكية باستخدام بايثون. 


تحليل بيانات الساعة الذكية باستخدام بايثون 
مجموعة البيانات التى أستخدمها لتحليل بيانات الساعة الذكية متاحة للجمهور على عاع1538. 
تم جمع مجموعة البيانات هذهفي البداية من 30 من مستخدمى ساعة ۳16016 الذكية. يمكنك 
سأبدأ الآن مهمة تحليل بيانات الساعة الذكية عن طريق استيراد مكتبات بايثون ومجموعة 

البيانات اللازمة: 

1۳001۲ Candas وه‎ 0 
31۳00 62 817 aS AP 
1۳001 1۵101011110 ۰0۷۵101 وه‎ 1 


import plotly.express as px 
11100 101۷ 0و وج واعه ژطه الام 2 و‎ 


02162 > Bd ead CSV )۲۵1 11۷72۸6۵1۲711۷ 106060 وس‎ 
print (data.head )(( 


Id ActivityDate TotalSteps TotalDistance TrackerDistance \ 


8.5e‏ 2.59 13162 6 1503960366 و 

1 1503960366 4/13/2016 10735 6.97 6.97 

2 1503960366 4/14/26 10460 6.74 6.74 

3 1503960366 4/15/2016 9762 6.28 6.28 

4 1503960366 ۰ 6 12669 8.16 8.16 
LoggedActivitiesDistance VeryActiveDistance ModeratelyActiveDistance \ 

8 0.0 1.88 0.55 

1 0.0 1.57 0.69 

2 0.0 2.44 e.40 

3 0.0 2.14 1.26 

4 0.0 2.71 0.41 
LightActiveDistance SedentaryActiveDistance VeryActiveMinutes 

e 6.66 e. 25 

3 4.71 0.0 21 

2 3.91 e. 3e 

3 2.83 0 29 

4 5.04 0 36 
FairlyActivelinutes LightlyActiveinutes SedentaryMinutes Calories 

0 13 328 728 1985 

1 19 217 776 1797 

2 11 181 1218 1776 

3 34 209 726 1745 

4 10 221 773 1863 


2۳۳۳ علم البيانات: عن طريقالامثلة 


قبل المضي قدمّاء دعنا نلقي نظرة على ما إذا كانت مجموعة البیانات هذه تحتوي على أي قيم 


فارغة أم لا: 
00 سنك و O‏ ال لبك .2 (OEE‏ بالك OE‏ 


Id 

ActivityDate 

TotalSteps 

TotalDistance 
TrackerDistance 
LoggedActivitiesDistance 
VeryActiveDistance 
ModeratelyActiveDistance 
LightActiveDistance 
SedentaryActiveDistance 
VeryActiveMinutes 
FairlyActiveMinutes 
LightlyActiveMinutes 


SedentaryMinutes 


© © © © © © © © © © © ۵ ۵ ۵ ه 


Calories 


dtype: int64 
لذلك لا تحتوي مجموعة البيانات على أي قيم فارغة. دعنا نلقي نظرة على المعلومات | لمتعلقة‎ 
بالأعمدةفي مجموعة البيانات:‎ 
ل طم‎ )0212 ۰.1۳8۴0 )( ( 


<class ۲۳2۳۱35 ۰» ۵ > 
Rangelndex: 940 entries, 6 to 39 


Data columns (total 15 columns): 


# Column Non-Null Count Dtype 

@ Id 940 non-null 164 

1 ActivityDate 946 non-null object 
2 TotalSteps 946 non-null int64 

3 TotalDistance 946 non-null float64 
4 TrackerDistance 946 non-null float64 
5 LoggedActivitiesDistance 940 non-null float64 
6 VeryActiveDistance 946 non-null float64 
7 ModeratelyActiveDistance 946 non-null float64 
8 LightActiveDistance 946 non-null float64 
9  SedentaryActiveDistance 940 non-null float64 
10 VeryActiveMinutes 946 non-null 11264 
11 FairlyActiveMinutes 940 non-null 164 
12 LightlyActiveMinutes 946 non-null int64 
13 SedentaryMinutes 946 non-null int64 
14 Calories 946 non-null int64 


dtypes: float64(7), int64(7), object(1) 
memory usage: 110.3+ KB 


None 


العمود الذي يحتوي على تاريخ السجل هو كائن (60>زده). قد نحتاج إلى استخدام التواريخفي 
تحليلناء فلنحول هذا العمود إلى عمود التاريخ والوقت «صحصامی عدطتاء026): 
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#Changing datatype of ActivityDate 


0212 ] ۲۸۵۲1۲۷1۷۲۵۲۵۲ [ < BA EO datetime (daa ] AE E Ea EE م‎ 
format="%m/%d/%Y”) 
DERE ) 2ك‎ 62 ER ESN 


انظر إلى جميع الأعمدة؛ سترى معلومات حول الدقائق النشطة جد والنشطة إلى حد ماء والنشطة 
الخفيفة والدقائق المستقرةفي مجموعة البيانات. دعنا نجمع كل هذه الأعمدةفي إجمالي الدقائق 
قبل المض قدمًا: 


data["TotalMinutes"] = data ["VeryActiveMinutes"] + 
data["FairlyActiveMinutes"] + data["LightlyActiveMinutes"] + 
data["SedentaryMinutes" [ 

print (data["TotalMinutes"] .sample (5)) 


دعنا الآن نلقي نظرة على الإحصائيات الوصفية لمجموعة البيانات: 


print (data.describe )( ( 


Id TotalSteps TotalDistance TrackerDistance \ 


count 9.400000e+02 946 , 066666 949.9 946.0 
mean 4.855407e+09 7637.910638 5.489702 5.475351 
std 2.424805e+099 5087.150742 3.924606 3.907276 
min 1.5639666+69 6. 066666 6. 0666066 9.000000 
25% 2.320127e+09 3789.750000 2.620008 2.620000 
50% 4.445115e+09 7465 . 5006068 5.245000 5.245000 
75% 6.962181e+09 1727.0 71589 760 
max 8.877689e+09 36619 . 8689 2 1 2.1 
LoggedActivitiesDistance VeryActiveDistance ModeratelyActiveDistance ١ 
count 946 . 000668 946. 0 940.90 
mean 0.108171 1.502681 0.567543 
std 0.619897 2.658941 0.883580 
min 6. 666666 6.6060666 6. 0660666 
25% 6 . 660666 ات نا‎ 6.0060666 
50% 6 . 660666 66 ۰.2.9 
75% 9.9999 2.052500 6 . 8 
max 4.94242 2106 "۰.23990 
LightActiveDistance SedentaryActiveDistance VeryActiveMinutes ١ 
count 940. 0 946. 0 946 , 0 
mean 3.349 9.001606 21. 14894 
std 2.040655 9.007346 32.844803 
min 6. 0606066 6.000666 e.eeeeee 
25% 1, 0 6. 0666666 6. 666666 
50% 3.365000 6. 066666 4. 0 
75% 4.782500 6. 000006 32.0 
max 10.71eeee ۰-20 219.06 
FairlyActiveMinutes LightlyActiveMinutes SedentaryMinutes ١ 

count 940.000000 949.0 946 , 0060666 

991.210638 192.812766 4 13 مقعم 

std 19.987404 109.174700 301.267437 

min e .eeeeee 6. 066666 6. 060666 

25% 6. 0060666 127.60 729.0 

599 6 .eeeeee 199.60 1657.60 

75% 19.000000 264.000000 1229.60 


max 143 . 0 518 . 6066 1449.0 


علم البيانات: عن طريق الامثلة 


Calories TotalMinutes 
count 0 946 ,. 0 
mean 2303.609574 1218.753191 
std 718.166862 265.931767 
min e .eeeeee 2. eeeeee 
25% 1828.0 989 . 560668 
50% 2134 . 0 1440. 066666 
75% 2793.250008 1449.0 
max 4966 . 666666 1446 . 666666 


تحليل بيانات الساعة الذكية 

تحتوي مجموعة البيانات على عمود السعرات الحرارية (2107165))؛ يحتوي على بيانات حول 

عدد السعرات الحرارية المحروقةفي اليوم. دعونا نلقى نظرة على العلاقة بين حرق السعرات 

الحرارية (calories burned)‏ وإجمالي الخطوات (total steps)‏ التي تم قطعهافي اليوم: 
figure = px.scatter (data_frame = data, x="Calories,"‏ 


۷7۲۲۵۲۵15609۲, Size 161۱۷۸۵61۷7۵11 1665 آ,‎ 


أ 062۷018 1 01 طه ۲ ع 
title="Relationship between Calories & Total Steps”)‏ 
figure. showO‏ 


Relationship between Calories & Total Steps 


TotalSteps 


0 1000 2000 3000 4000 5000 


Calories 


يمكنك أن ترى أن هناك علاقة خطية بين العدد الإجمالى للخطوات وعدد السعرات الحرارية 
المحروقةني اليوم. دعونا الآن نلقي نظرة على متوسط العدد الإجمالي للدقائق النشطة ( 26076 
(minutes‏ اليوم: 


label = ["Very Active Minutes", "Fairly Active Minutes ", 
Lightly Active Minutes", "Inactive Minutes "] 
counts = data ] ["VeryActiveMinutes", "FairlyActiveMinutes", 


LightlyActiveMinutes", "SedentaryMinutes"] ] .mean() 
نو‎ = | SOLA, هه ای‎ DANK, ای‎ 


fig = go.Figure (data= [go.Pie(labels=label, values=counts) [( 
۴1 . ۵021۲6 121۷0۱ Ele اه‎ ۲0۲21 ۵۲1۲۷6 11۳10665 1( 
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۶۴1 . 1۵02۲6 traces )۵۲۵۲10۶02۲ 12061410۵1660۲ م ۵116۲ كلو م د‎ 
lex EE ONE Si 26-30, 

marker=dict (colors=colors, line=dict (color='black'", 
width=3) ) ) 
۶1 0 . SACO 


Total Active Minutes 


192.812766 


uan 


ملاحظات: 
1. 81.3 من إجمالي الدقائق غير النشطة (102001760)في اليوم. 
2 15.8/ من الدقائق النشطة بشكل خفيف (20076 راع[ )في اليوم. 
3 في المتوسط. كانت 21 دقيقة فقط (1.74./) نشطة للغاية (ع 26057 تإتاع7). 
4 و1.11/ (13 دقيقة) من الدقاتق النشطة إلى حد ما (ع2]17 121117) في اليوم. 


قمنا بتحويل نوع بيانات عمود (۸۰۷101(۵60) إلى عمود التاريخ والوقت أعلاه. دعونا 
نستخدمه للعثور على أيام الأسبوع للسجلات وإضافة عمود جديد لمجموعة البيانات هذه باسم 
:(Day)‏ 


022 ] Dey Nl <S 02۳62 ] ۲۸۵۲1۷1۲۱۷۱۲۵۲۵۲ [ . 06 day Mame) 
9110 (Saal ۲۲۵۷ | ۰5620 )( ( 
دعنا الآن نلقي نظرة على الدقائق النشطة جدا. والنشطة إلى حد ماء والنشطة الخفيفةفي کل یوم‎ 


fig = 99.۳1 بان‎ 

۶10.2006۵606 (IO. BAF) 
x=data ["Day"], 
y=data["VeryActiveMinutes"], 
name='Very Active’, 
11211667 E SESE ۲ 0۱۲ 

0) 

(IO BAE)‏ 30402226 . دع 


علم البيانات: عن طريق الامثلة 


x=data ["Day"], 
y=data["FairlyActiveMinutes"], 
name='Fairly Active’, 
11211661۲ 0010122 ۲ ۴ 
0) 
۴10.2006۵606 (IO BAE) 
x=data ["Day"], 
y=data["LightlyActiveMinutes"], 
name='Lightly Active’, 
Mar ker COlOEI DIME, 
)) 
۴1 . 1002۲6 12101 (Sa EMOde= SEOUDl, (45-حه 01621091 ۲1 _ و میهد‎ 
۶10 . 51070 


30k I Very Active 
1۱ Fairly Active 
Lightly Active 


۱ 
|| 
| 


دعنا الآن نلقي نظرة على عدد الدقائق غير النشطةني كل يوم من أيام الأسبوع: 


02۷7 > 4262 ] Dav "| ۰۷721۱۵ لمك‎ 5) 

label = day.index 

counts = data ["SedentaryMinutes"] 

COLOES | "060407 هه‎ , COANE, لظ‎ SKYE, 
eyan E, ۲ 96۷و‎ [ 


fig = 0و‎ . 1 09۲6 (data= [go.Pie(labels=label, values=counts) [( 
۶1 ن‎ . ۵02۲6 1310۱ )۲1۳۲16 Eee ۲ ۲8۵0۳۲1۷76 MinUeeSs Day) 
۴1 ل‎ . 1002۲6 2065 (ROMEL IRE OS 1206141061060۲, 6۲10۴0۲۷۵116۲ م‎ 


OME 2-0‏ 2 ا 


113 7161201 01 (colors=colors, 13116201 6 (color='black'", 
width=3) ( 


۶1 0 . 5107 0 


تحليل بيانات الساعات الذكية باستخدام بايثون 


0 
1 


Inactive Minutes Daily 


Thursday 
Monday 
Wednesday 
Saturday 
Tuesday 
Friday 
sunday 


هه داه هاه 


لذا فإن الخميس هو أكثر يوم غير نشط وفقاً لنمط حياة جميع الأفرادفي مجموعة البيانات. دعنا 
الآن نلقي نظرة على عدد السعرات الحرارية المحروقةني کل يوم من أيام الأسبوع: 


Calor eS > 8553 ] ۲۲۵۷۲ | ۰۷7211۵ COUN ESO 

label = calories.index 

COURES < 4212 ] ۲۰۵۵10131 5 | 

61525 < ]۲9۵10۲, ۲110۳0۵18۲, ONE, ما۳‎ 16۵11۵۲, 
eyam, "orange ll] 


fig = go.Figure (data= [go.Pie(labels=label, values=counts) [( 
۴1 . ۵021۲6 1210۱۲۲ )1۳۲16 Cede 021 2225م‎ BUENEd Dally) 
ENG ۵02۲6 traces ۵۲۵۲1۳۴02۲ظ)‎ lae le RENE , ۵۲10۴02 Ma lel 
عت تا‎ ONE SH Ze oU 

marker=dict (colors=colors, line=dict (color='black'", 
width=3) ) ) 
۶10 . 5۳070 
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Calories Burned Daily 


Tuesday 
Monday 
Saturday 
Wednesday 
Thursday 
Friday 
sunday 


لذلك. بعد يوم الثلاثاء أحد أكثر الأيام نشاطًا لجميع الأفرادفي مجموعة البيانات» حيث تم حرق 
أكبر عدد من السعرات الحرارية يوم الثلاثاء. 


2۳۳ علم البيانات: عن طريقالامثلة 


هذه هي الطريقة التي يمكنك بها تحلیل بیانات الساعة الذكية باستخدام لغة برمجة بایشون. هناك 
الکثیر الذي يمكنك القیام به باستخدام مجموعة البیانات هذه. يمكنك أيضًا استخدامه للتنبؤ 
الملخص 

هذه هی الطريقة التی یمکنك بها تحلیل البیانات التی جمعتها ساعة ذكية حول اللياقة البدنية 
باستخدام بايثون. الساعات الذكية مفضلة من قبل الأشخاص الذین يرغبونفي رعاية لیاقتهم 
البدنية. يعد تحلیل البیانات التي تم جمعها عن لیاقتك إحدى حالات استخدام علم البياناتفي 
الرعاية الصحية. آمل أن تکون قد آحببت هذه المقالة حول تحلیل بیانات الساعة الذكية باستخدام 


بايثون. 


تحليل 2022 1۴1 باستخدام بايثون 


Q00 
-1 


۲۳1, 2022 تحليل 2022 121 باستخدام بایلون‎ 5 
Analysis using Python 

ينتج عن كل حدث رياضي اليوم الكثير من البيانات حول اللعبة» والتي تستخدم لتحليل أداء 
اللاعبين والفرق وكل حدث من أحداث اللعبة. لذا فإن استخدام علم البيانات موجودني كل 
رياضة اليوم. حالیّا. يعد 2022 ,1۳1 أحد الأحداث الرياضية الشهيرة التي تقامفي الهند. لذلك 
إذا كنت تريد معرفة كيفية تحليل 2022 ,۰1۳1 فهذه المقالة مناسبة لك.في هذه المقالق سوف 
آخذك خلال مهمة تحليل 2022 ,11 باستخدام بايثون. 


تحليل 2022 ,121 باستخدام بايثون 
يتم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل 2022 1۲1 من 1628016. يمكنك 
تنزيل مجموعة البيانات هذه من هنا. لنبدأ الآن هذه المهمة عن طريق استيراد مكتبات بايثون 
ومجموعة البيانات الضرورية: 
0 وه 0522025 1۳001۲ 
P<‏ و ۵2016۵98 .۰ 0101۷ 1۳001 


110002 Plot ly. GEAapn OMNI 2655 0و وج‎ 


0223 > 24 7 22341 )ترفك‎ TEE 2022 ES) 
print (data.head () ) 


match_sd date venue \ 
8 1 March 26,2022 Wankhede Stadium, Mumbai 
1 2 March 27,2022 Brabourne Stadium, Mumbai 
3 3 March 27,2022 Dr DY Patil Sports Academy, Mumbai 
3 4 March 28,2022 Wankhede Stadium, Mumbai 
4 5 March 29,2022 Maharashtra Cricket Association Stadium, Pune 


team1 team2 stage toss_winner toss_decision first_ings_score \ 

Chennai Kolkata Group Kolkata Field 131‏ و 

1 Delhi Mumbai Group Delhi Field 177 

2 Banglore Punjab Group Punjab Field 205 

3 Gujarat Lucknow Group Gujarat Field 158 

4 Hyderabad Rajasthan Group Hyderabad Field 218 
first_ings_wkts second_ings_score second_ings_wkts match_winner won_by ١ 

8 5 133 4 Kolkata Wickets 

1 5 179 6 Delhi Wickets 

2 2 208 5 Punjab Wickets 

3 6 161 5 Gujarat Wickets 

4 6 149 7 Rajasthan Runs 
margin player_of_the_match top_scorer highscore best_bowling \ 

8 6 Umesh Yadav MS Dhoni se Dwayne Bravo 

3 4 Kuldeep Yadav Ishan Kishan 81 Kuldeep Yadav 

2 5 Odean Smith Faf du Plessis 88 Mohammed Siraj 

3 5 Mohammed Shami Deepak Hooda 55 Mohammed Shami 

4 61 Sanju Samson Aiden Markram 57 Yuzvendra Chahal 
best_bowling_figure 

3 3--20 

1 3--18 

2 2--59 

3 3--25 

4 3--2 


عله البيانات: عن طريق الامثلة 
تحتوي مجموعة البيانات على جميع المعلومات اللازمة لتلخيص قصة 2022 1۲1 حتى الآن. 
لنبدأ بالنظرفي عدد المباريات التي فاز بها كل فريقفي 2022 1۲1: 


۴1 عدم = همان‎ Dar (data, 20212 ] melen winner £1, 
t1tle"Number of Matches Won 1n IPL 20227) 
figure. show )( 


Number of Matches Won in IPL 2022 


count 


® 
5 


0 


0 


e 
7 


^o, ۵ 4 Gi 
3 5 ny 3 
وه‎ 7 2 02 7 


۳ 
و 
© 
$ 
8 
3 
- 


match_winner 


لذاء حاليّاء يقود 126[ البطولة بفوزه بثمانی مباريات. إنه إنجاز كفريق جديد ل 126[ في 
1. الآن دعونا نرى كيف تفوز معظم الفرق. سنحلل هنا ما إذا كانت معظم الفرق قد فازت 
بالدفاع (الضرب أولاً) أو المطاردة (الضربة الثانیة): 


02166 wen ۷۲ [| SS 0212 ] ۲۵۲ ۷۲ MAS Mieke CRASS ۲ 
RUS: ۳۳۵۶۴۵901 كه‎ 
won Ov > 421 ] won OV [ r vuealue COURES() 

label > won Oy. 16 

val ues‏ ترط WON‏ واصناهم 

COLOES < ] ۲9۵10۲ , ۲11 0۳1۲0166۴۲ [ 


fig = go.Figure (data= [go.Pie (labels=label, values=counts) [( 
فط‎ . ۵02۲6 1210۱۲ Ei Ele ext NUNSeE Of 1266265 WON EV 
Defending Or Chasing') 
۶۴1 . 1002۲6 traces (Mower Imi O< 12061106062, 
textinfo='value ,' 

ex Ef ONE Si لا وه‎ 

marker=dict (colors=colors , 

1 ine=di ct (COLOE= BDlackl, 

width=3)) ) 
۶1 0 . 5۳107 )( 


تحلیل تأثیرات 0۷11-19 باستخدام بایئون 89 


Number of Matches Won By Defending Or Chasing 


8 Chasing 
I] Defending 


لذلك. حاليًاء تم ربح 24 مباراة أثناء مطاردة الهدف. و 22 مباراة فازت أثناء الدفاع عن الهدف. 
الآن دعنا نرى ما تفضله معظم الفرق (الضرب بالملاعب 2610128 01 هصتتهه) بعد الفوزفي 
القرعة: 


EOS 1862 ] ۲6۵95 06631 STONE ۰721176 EOUMES )( 
label toss.index 
counts = 0۵95 ۰.721 165 
6867828 > ] ۲5۷۵1۱9۵۲ , ۲۷۵110۲ ۲ [ 


fig = go.Figure (data= [go.Pie (labels=label, values=counts) [( 
۶10 د‎ ۵0916 12101۲ )۲61۲16 Cex 55 KOSS Dec 9108 ۲( 
۶1 . ۵02۲6 و۲۵6۵‎ (NOVO IME 0< 1۵۳611067661 ۲ 

61۴02۲7۵1 م6۲‎ COSTE ONE 912630, 

103 161201 تاه‎ (colors=colors , 

line=dict (color='black'", 

width=3)) ) 
۶1 0 . 5107 )( 


Toss Decision 


O Field 
O غ52‎ 


۳ 2 علم البيانات: عن طريق لامثلة 


وهكذاء یختار معظم القادة اللعب بعد الفوزفي القرعة. حتی الان.في 43 مباراق اختار الکابتن 
اللعب أولاً. وفی ثلاث مباریات فقطء اختار القادة المضرب آولاً. الآن دعونا نری أفضل الهدافین 
في معظم مباریات 2022 1]: 

E GUE - دم‎ BaF (daia, Xda EOS SESE, 


1: 162 ۵۵ دا مهو‎ TEL 20220) 
figure. show )( 


Top Scorers in IPL 2022 


LN 0 


= 5 
۱۲۰۵ 5۷ 

au03s6u wen 0 
DEES | 
لازاه‎ PAO 7 
9۱118۵۸ YP IIL 55 
69186 ۱۵۸ 2 
9195 mM 8 


count 
بي يم‎ 55 
SN 1 


pıopauant aur 77 
20 ap uound 0 

۱8950۲ 3101۷ 1 

۱۱۵5۷۶۱۱۱۸۸ 305۷ | 

2000 ۸۵۸ 5 ER 
uemeUG ۰۱0۷۱۱۲۲۶ 7777 
eApued ۱۱۱۵۸۵۳۱ كك‎ ES 

18 ٩1 ۱۱۲ 7777 

048۱۱ USN | 

Uo 181 7 


2 ۸6 ۵8۳ )ةا 


۱۱9۱۷5۱۱۷ UPUST 7777 
۶۱550۱4 NP دمر‎ 0 

epooH ۱۵۹0 7 

wee UPI ب‎ 
و۱۱‎ ue wqnus 71117 

sur un? 700 نی‎ 
ewaeus ۱۱۵۱۱۶۱۰۱۱۷۶ 0 

۸۵۲9 ۸۵۱۵۷۱۱۱۰۸۲۸۱۶ 777717 
2010/۸ ۱۱۰۱۰ 1 

20۸۱۱۵۵ ۲۰۱۱۲۱ 111 


top_scorer 


حالیّا. كان Jos Buttler‏ هداقاني 5 مباريات. إنه يبحث في لمسة رائعة. دعنا نحللها بعمق من 
خلال تضمين الأشواط التي سجلها أفضل الهدافين: 


E ددم < هلان‎ Bar 99ج رتاو‎ EOD SESE, 
۷ < 0219 ] ۲۹ 0۳50016۳۷1 مب‎ 
611452 < 0212 ] ۲۸0۳500161 م‎ 
21162۳108 950022525 in باظ1‎ 20227( 
figure. show )( 


Top Scorers in IPL 2022 


highscore 


qe dı nue 7595 
Je usa 8 


e 


2 


highscore 
پس پو ت‎ 
5 © 6 
ه‎ 5 5 8 
wm 
لا‎ 
° mmm 
0 0 
mm 
ل]‎ 
لا‎ wm 
۳ 
۱:5 ۳۳ 
الخ‎ ۳ E N 
9۱۱6۱5 ۱۵۱/۹۱۰۱۱۷ EE 
9۱۳۸۱ ۱۱۱۶ 8 
۱ oS 6 
215۲ 7 
na wea Us ۷ 
و۱۵‎ pH 77771797 
ıa 0۱۵۵۵ ۱ 
س ت ي هھ‎ 
5 5 5 86 
5 


۸ 09۸ 1 


top_scorer 


تحليل تأثيرات 601710-19 باستخدام بايثون ا 


حتى الاآن. سجل 8116161 05[ ثلاثة قرون. وسجل 1321 ]× قرنين من الزمان. الآن دعنا 
نلقی نظرة على أكثر لاعب من جوائز المباراة حتى الآنفي 2022 .121: 
م0۵01 Dar (delay, x < 4202 ] Paver OE ERE‏ دم > هنال ۴1 


title="Most Player of the Match Awards”) 
figure. show )( 


Most Player of the Match Awards 


4 


3 


5 
85 2 
0 


0 
5 E: 
3 85 
2 3 


player_of_the_match 
لذا يتصدر ۷20۵۷ 1610660 قائمة لاعبى جوائز المباراة بأربع مباريات. إنها بطولة رائعة ل‎ 
هذا العام. الآن دعونا نلقي نظرة على 00/1675 مع أفضل شخصیات‎ Kuldeep Yadav 
ني معظم المباریات:‎ 5 


۴1 دده دم = هتتان‎ )0212, 20212 ] Oeste 0۷11001 , 
111102۷ Best Bowlers IM TEL 20220) 
figure. show )( 


Best Bowlers in IPL 2022 


يمكنك أن ترى 0221© 022مع112لآ لديه أفضل شخصيات 0771675 طني أربع مباريات. لذا 
فهذه بطولة رائعة د 012121) ۷۱۵2۷۲6 هذا العام آیضا. 

دعنا الآن نلقي نظرة على ما إذا كان معظم الویکیت ۷1016060 يسقط آثناء تحدید الهدف أو آثناء 
مطاردة الهدف: 


علم البيانات: عن طريق الامثلة 


figure = 60و‎ . "10112©)( 

E1 0125 . 2001266 (GOBASE) 
x=data ["venue"], 
۱ تاو‎ 9۱۱۱۶۱۰۰۱۳۰ EROS ESN 
name='First Innings Wickets, 
marker color='gold' 


۳ 


(2ظ (GO:‏ 2001266 . نان ۶۴1 
x=data ["venue"],‏ 
و[" 15 1005 ۲566۵80 ] ۷20262 
,6165 ۱11 ووصتصص؟ 0ع۵ع56 ۲ 82716 


Mar ker اطن 131 ۲ عد601‎ 


۳ 


(45-< 101621001 _ و دنهد ,۲ صناهون ۲ 218006ظ) ات 121 02۵ صنا . نان ۴1 
59070 . 210112 


۲۳ First Innings Wickets 
7 Second Innings Wickets 


© و دح 
o © 8 °‏ 


0 


3 
0 
0 


لذلكني استاد ۷۵۳16606 في مومباي واستاد )1۷1 في ۳6 ۰ تسقط معظم الويكيت أثناء 
مطاردة الهدف. وفي الملعبين الآخرین. تسقط معظم الويكيت آثناء تحديد الهدف. هذه هي 
الطريقة التي يمكنك بها تحليل وتلخيص قصة 2022 ,121 باستخدام بايثون. 


الملخص 

هذه هي الطريقة التي يمكنك بها أداء مهمة تحليل 2022 ,151 باستخدام بايثون .یسیر 1۲1 
2 بشكل رائع بالنسبة إلى غ+311[12) كفريق جديد هذا العام. لقد كان Jos Buttler‏ و KL‏ 
م1 رائعينفي التعامل مع عصا الكريكيت «bat‏ وكان Yuzvendra Chahal‏ و Kuldeep‏ 
۷ لارائعينفي التعامل مع الرمي 6071. أتمنى أن تكون قد أحببت هذه المقالة حول تحليل 
1102 باستخدام بايثون. 


تحليل تأثيرات 0110-19) باستخدام بايثون 


©0510- باستخدام بايثون‎ ٥٥714-19 تحليل تأثيرات‎ )6 
19 Impacts Analysis using Python 

أدى اندلاع 007714-19 إلى الكثير من القيود التي أدت إلى العديد من التأثيرات على الاقتصاد 
العالمي. تأثرت جميع البلدان تقريبًا سلبًا بارتفاع حالات 007101-19. إذا كنت تريد معرفة كيفية 
تحليل تأثيرات 00۷1-19 على الاقتصاد. فهذه المقالة مناسبة لك.في هذه المقالة سوف 
آخذك خلال مهمة تحليل تأثيرات 0714-19© باستخدام بايثون. 

تحليل آثار 19 -205710) (دراسة حالة) 


أثرت الموجة الأولى من 001710-19 على الاقتصاد العالمي حيث لم يكن العالم جاهرًا آبدا 
لمواجهة الوباء. وقد أدى ذلك إلى ارتفاع عدد الحالات وارتفاع الوفيات وارتفاع معدلات البطالة 
وارتفاع معدلات الفقر. مما أدى إلى تباطؤ اقتصادي. هناء أنت مطالب بتحليل انتشار حالات 
00710-909 وجميع آثار 00۷1-19 على الاقتصاد. 


يتم تنزیل مجموعة البیانات التي نستخدمها لتحلیل تأثیرات 0711-09 من ع162281. يحتوي 


.(the country code) رمز البلد‎ 1 
.(name of all the countries) اسم کل الدول‎ 2 
.(date of the record) تاریخ التسجیل‎ .3 


Human development index of all the ) موشر التنمية البشرية لجميع الدول‎ .4 


.(countries 
.(Daily covid-19 cases) اليومية‎ Covid-19 حالات‎ .5 
.(Daily deaths due to covid-19) Covid-19 الوفيات اليومية بسبب‎ .6 
.(stringency index of the countries) موّشر صرامة البلدان‎ .7 
.(the population of the countries) سكان الدول‎ .8 


9. نصيب الفرد من الناتج المحلي الإجمالي للدول ) GDP per capita of the‏ 


.(COUNtries 


يمكنك تنزيل مجموعة البيانات هذه من هنا. 


عم البيانات: عن طريقالامثلة 


تحليل تأثيرات 205710-19) باستخدام بايثون 
لنبدأ مهمة تحليل تأثيرات 0071-19 عن طريق استيراد مكتبات بايثون ومجموعة البيانات 
اللازمة: 

0 وه 5220295 1۳0011۲ 


2۶ وج ۵201۵98 .۰ 0101۷ 1۳0011 
0و وج واه EAP OB‏ 101۷ 1100021 


0202 > 0۰1620 فت .۰ 0313 2104 21151505 22 ) ترفك‎ 
03222 = 00۰6۵20 ESV )! Eaw Calla كه‎ 
9111 (OEE) 


CODE COUNTRY DATE HDI TC TD STI \ 

e AFG Afghanistan 2019-12-31 6.498 0.eeeeee 0.eeeeee 0 

1 AFG Afghanistan 2020-01-01 6.498 6.88860 6.68666 0 

2 AFG Afghanistan 2020-01-02 6.498 0.000000 0.000000 0 

3 AFG Afghanistan 2020-01-03 6,498 0.000000 0.000000 0 

4 AFG Afghanistan 2020-01-04 6.498 6.88800 0.eeeeee 0 

50413 ZWE Zimbabwe 2020-10-15 0.535 8.994048 5.442418 ۰ 5 

50414 ZWE Zimbabwe 2020-10-16 6.535 8.996528 5.442418 5 

56415 ZWE Zimbabwe 2020-10-17 0.535 8.999496 5.442418 4.341855 

56416 ZWE Zimbabwe 2020-10-18 6.535 9.000853 5.442418 4.341855 

560417 ZWE Zimbabwe 2020-10-19 6.535 9.005405 5.442418 ۰ 5 
POP GDPCAP 

8 17.477233 4 

1 17.477233 4 

2 17.477233 ۰4 

3 17.477233 4 

4 17.477233 4 


50413 1 . 54991 


7 
50414 16.514381 1 
50415 16.514381 1 
56416 16.514381 7.549491 
50417 16.514381 7.549491 


[50418 rows x 9 columns] 


تحتوي البيانات التي نستخدمها على بيانات عن حالات كوفيد -19 وتأثيرها على الناتج المحلي 
الإجمالي من 31 ديسمبر 2019 إلى 10 أكتوبر 2020. 


تحضير البيانات 

تحتوي مجموعة البيانات التى نستخدمها هنا على ملفي بيانات. يحتوي أحد الملفات على بيانات 
أولية» بينما يحتوي الملف الآخر على ملف تم تحویله لكن يتعين علينا استخدام مجموعتي 
البيانات لهذه المهمة» حيث يحتوي كل منهما على معلومات مهمة بنفس القدرفي أعمدة مختلفة. 
لذلك دعونا نلقي نظرة على مجموعتي البيانات واحدة تلو الأخرى: 


تحليل تأثيرات 601710-19 باستخدام بايثون 


print (data.head )( ) 


CODE COUNTRY DATE HDI TC TD STI POP GDPCAP 
AFG Afghanistan 2019-12-31 0.498 0.0 0.0 0.0 17.477233 7.497754 
AFG Afghanistan 2020-01-01 0.498 0.0 0.0 0.0 17.477233 7.497754 
AFG Afghanistan 2020-01-02 0.498 0.0 0.0 0.0 17.477233 7.497754 
AFG Afghanistan 2020-01-03 0.498 0.0 0.0 0.0 17.477233 7.497754 
AFG Afghanistan 2020-01-04 0.498 0.0 0.0 0.0 17.477233 7.497754 


© ده یبا و 


11 ۱6 (Gall a2 ۰1620 )( ( 


iso_code location date total_cases total_deaths \ 
6 AFG Afghanistan 2019-12-31 6.6 6.6 
1 AFG Afghanistan 2020-01-01 6.6 6.8 
2 AFG Afghanistan 2020-01-02 6.86 6.86 
3 AFG Afghanistan 2020-01-03 6.6 6.8 
4 AFG Afghanistan 2020-01-04 0.0 0.0 


stringency_index population gdp_per_capita human_development_index \ 


e 6.6 38928341 1803.987 0.498 

3 6.6 38928341 1803.987 6.48 

2 6.6 389281 1803.987 0.498 

3 6.6 38928341 1803.987 0.498 

4 6.6 38928341 1803.987 0.498 
Unnamed: 9 Unnamed: 16 Unnamed: 11 Unnamed: 12 Unnamed: 13 

8 #۱۱ ! #NUM! #NUM ! 17.477233 4 

1 #NUM! #NUM! #NUM ! 17.477233 4 

2 #NUM! #NUM! #۱ ! 17.477233 ۰ 4 

3 #NUM! #NUM ! #NUM ! 17.477233 4 

4 #NUM! #NUM ! #NUM ! 17.477233 4 


بعد الحصول على انطباعات أولية عن مجموعتى البيانات. وجدت أنه يتعين علينا دمج 
مجموعتى البيانات من خلال إنشاء مجموعة بيانات جديدة. ولكن قبل إنشاء مجموعة بيانات 
جديدة؛ دعنا نلقى نظرة على عدد عینات كل بلد الموجودةفي مجموعة البيانات: 


0216 ] LCOUNERY II value COURE SO 


Thailand 294 
China 294 
Norway 294 
Afghanistan 294 


United Arab Emirates 294 


Tajikistan 172 
Comoros 171 
Lesotho 158 
Hong Kong 51 
Solomon Islands 4 


Name: COUNTRY, Length: و21‎ dtype: int64 


لذلك ليس لدينا عدد متساو من العينات لكل بلدفي مجموعة البيانات. دعونا نلقي نظرة على قيمة 
المنوال :(mode value)‏ 


علم البيانات: عن طريق الامثلة 
Mode‏ () واصتاهی_ Evalue‏ 812118 421231 


8 254 
dtype: 15+64 


إذن 294 هي قيمة المنوال. سنحتاج إلى استخدامه لقسمة مجموع جميع العينات المتعلقة بمؤشر 
التنمية البشرية ونصيب الفرد من الناتج المحلي الإجمالي والسكان. فلنقم الآن بإنشاء مجموعة 
بيانات جديدة من خلال دمج الأعمدة الضرورية من مجموعتي البيانات: 


7۸90۲6921119 the data 


code = data ["CODE"] .unique().tolist(0 
COURE EY ع‎ 1۵12 ] COUNTRY "| . باه ذصتا‎ )( EOL SEO 
03ظ‎ =[] 

ات تا 

1۶۵1 < [1 

sti =[] 

۴001021811 ط0‎ = 40218 ] ۲5۶۵۳۲۲ sS د () باه لصا‎ EOL ASE 
gdp >] [ 


186۶6 J اناد‎ COVE EW: 


.append ) (data. loc [data ] I COUNIRY'"] == 1, "HDI"|) .Sum )( /294(‏ 03ظ 
["location"] ==‏ 0332 ] عه . 4332 ) ) tc.append‏ 


7 
زر 21 الكو‎ SEE) 
120۰2006۳00 ) 02122 ۰.1060 ] 0332 ["location"] == i, 
۲۵۲۵1 لاا‎ ( SUM 
511 . 2۵۳006۳۴0 ) 272.106] 0312 ] ۲۵۲7۲۲۴۷۲ [ او . ([ ۹۲۲۲" مد حح‎ )( /294( 
001212110۳8 ۰. 2006۳00 ) (daca 106 ]02122 ] ۲1۵6۵۵۲1 ORL] U, 


(294/ () تاو . ( [ ۱۵۵۵01108 


299692160 data > 0۰۲2۲۵۳2۳6 (li SE )210 )6۵06, COUNEEV, MIT, 

EE EO SEM, 6551-2 رل‎ 

COLUMNS > | 56 022 2107 COdel, انا‎ HDL, 
10121 Cases, "۲1۲۵۵1 ۱۵9 


"۱ 


"۱ 


۹121 061057 1۳8066۲, ۲۲0۵۱021 21310۳7( 
۳111 )299692160 0262 .1620 )(( 


Country Code Country HDI Total Cases Total Deaths \ 
6 AFG Afghanistan 9 5126433.0 165875.@ 
1 ALB Albania 0.600765 1071951.@ 31656 .6 
2 02۸ Algeria 0.754000 4893999 .© 266429 .© 
3 AND Andorra 1 223576.0 9850.0 
4 AGO Angola 0.418952 304005 .6 11820.0 


Stringency Index Population 
3.049673 17.477233 
3.4 14.872537 
3.195168 17.596309 
2.677654 116 


sun © 


2.965560 17.307957 


تحليل تأثيرات 0۷11-19 باستخدام بایئون 


و 
1- 


لم أقم بتضمين عمود نصيب الفرد من الناتج المحلي الإجمالي حتى الآن. لم أجد الأرقام 
الصحيحة للناتج المحلي الإجمالي للفردفي مجموعة البيانات. لذلك سيكون من الأفضل جمع 
البيانات يدويًا حول نصيب الفرد من الناتج المحلي الاجمالي‌في البلدان. 


نظرًا لوجود العديد من البلدانفي هذه البیانات. فلن يكون من السهل جمع البيانات يدويًا حول 
نصيب الفرد من الناتج المحلي الإجماليني جميع البلدان. لذلك دعونا نحدد عينة فرعية من 
مجموعة البيانات هذه. لانشاء عينة فرعية من مجموعة البيانات هذه سأختار أفضل 10 دول بها 
أكبر عدد من حالات .)٥۷14-19‏ ستكون عينة مثالية لدراسة الآثار الاقتصادية لفيروس کورونا. 
لذلك دعونا نفرز البيانات وفقا لإجمالي حالات 007104-19 : 


2562 22265 Datla 26062012395 EO Total Cases 


CAE < 299۲69260 02۲89 SOLE _ UAE UES )0۷< ] ۲۲۵۲81 7 
ascending=False) 
print (data.head () ) 


Country Code Country HDI Total Cases Total Deaths \ 
200 USA United States 0.92400 09 26477574.@ 
27 BRA Brazil 0.75900 0 14340567.@ 
956 IND India 0.64000 407771615.@ 7247327.@ 
157 RUS Russia ۰ 0 2131571.@ 
156 PER Peru 0.59949 74882695 .© 30266038 .6 


Stringency Index Population 


268 39 19.617637 
27 3.136028 19.174732 
99 3.610552 21.045353 
157 3.380088 18.798668 
156 3.430126 17.331165 


الآن إليك كيف يمكننا تحديد أفضل 10 بلدان بها آکبر عدد من الحالات: 
#Top 10 Countries with Highest 00714 25‏ 


data = data.head(10) 
911 Me )0212( 


Country Code Country HOI Total Cases Total Deaths ١ 
200 USA United States 0.924000 7460140958. ۰ 0 
27 BRA Brazil 0.759000 425794517. ۰ 9 
و5‎ Ino 10842 0.640060 9 247327 
157 RUS Russia 0.816000 0 2131571.0 
158 PER Peru 0.599490 ۵ 3020038.0 
125 MEX Mexico 0.774000 0 7295850.0 
178 Esp Spain 0.887969 6.9 5510624.0 
175 ZAF South Africa 0.608653 63027659,0 1357682. 
42 col Colombia 0.581847 ۰ 0 1936134.0 
وود‎ GBR United Kingdom 0.922000 ۰ 8 7249573.0 


Stringency Index Population 


200 3.350949 19.617637 
27 3.136028 2 
9e 3.610552 21.045353 
157 3.380088 8 
15e 3.430126 1165 
125 3.019289 18.674802 
178 3.393922 17.660427 
175 3.364333 6 
42 3.357923 17.745037 


159 3.353883 16.033340 
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سأضيف الآن عمودين آخرين (نصيب الفرد من الناتج المحلي الاجمالي قبل00710-19© ۰ 
نصيب الفرد من الناتج المحلي الإجمالي خلال 0۷10-19 )إلى مجموعة البيانات هذه: 


0212 ] ۲۵۲5 56۶۴۵۲6 Covad < ]65279 53, 8897۰49, 2100۰75 
,9946۰.03 7027-13 5 

]4 2354 . 41 ,6424 . 98 ,6001 .40 , 4 

022 ] ۲۵6۲5 وصنعنط‎ Cova SEN < 65549567 GUO 84, LOOO 
8346۰70 ,6126۰.87  /, 2 


]40284 ۰.64 ,5332 77,500 6 
911 1 )0212( 


Country Code Country HDI Total Cases Total Deaths \ 
268 USA United States 0.924000 0 26477574.@ 
27 BRA Brazil 09.759000 0 14346567 .8© 
ge IND India 0.640000 407771615.@ 7247327 .9 
157 RUS Russia ۰ 0 2131571.@ 
156 PER Peru 0.599490 5.8 3026638 .© 
125 MEX Mexico 0.774000 74347548 .8© 7295850.@ 
178 ESP Spain 0.887969 73717676.@ 5510624.@ 
175 ZAF South Africa 3 63027659.@ 1357682.@ 
42 COL Colombia 7 2222.8 1936134.@ 
199 GBR United Kingdom 0.09 59475032.@ 22573 .© 


Stringency Index Population GDP Before Covid GDP During Covid 


266 3.350949 19.617637 65279.53 63543.58 
27 3.136028 19.174732 8897.49 6796.84 
9e 3.610552 21.045353 2100.75 1900.71 
157 3.380088 18.798668 11497.65 10126.72 
156 36 17.31165 7027.61 6126.87 
125 3.019289 18.674802 9946.03 8346.70 
178 3.393922 17.660427 29564.74 27057.16 
175 33 17.898266 6661.46 5090.72 
42 3.357923 17.745037 6424.98 5332.77 
159 3.353883 18.033340 42354.41 40284.64 


ملاحظة: يتم جمع البيانات المتعلقة بنصيب الفرد من الناتج المحلي الإجمالي يدويًا. 


تحليل انتشار 0011-19 
لنبدأ الآن بتحلیل انتشار 005710-19 في جمیع البلدان التي بها آکبر عدد من حالات الاصابة 


بفیروس 0۷10-19). سأقوم أولاً بإلقاء نظرة على جميع البلدان التي بها آکبر عدد من حالات 
الاصابة بفیروس 071-19 : 
م 001۷7 x<‏ , اوهوهن ۵]۵1 ۷2۲ (data,‏ 522 0۶ < و صلان ۶1 


title="Countries with Highest 60710 Cases”) 
figure. showO 


تحليل تأثيرات 6014-19 باستخدام بايثون 


Countries with Highest Covid Cases 
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يمكننا أن نرى أن الولايات المتحدة لديها نسبيًا عدد كبير جد من حالات 005710-19 مقارنة 
بالبرازيل والهندفي المركزين الثاني والثالث. دعنا الآن نلقي نظرة على العدد الاجمالی للوفيات 
بين البلدان التي بها أكبر عدد من حالات الإصابة بفيروس 0010-19 : 

م “2ك (data, 51716031 Deaths,‏ 2552 عدم > 2101126 


title="Countries with Highest Deaths”) 
figure. 99070 


Countries with Highest Deaths 
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تمامًا مثل العدد الإجمالي لحالات ٥٥۷14-19‏ تتصدر الولايات المتحدة عدد الوفیات. مع 
البرازيل والهندني المركزين الثاني والثالث. شىء واحد يجب ملاحظته هنا هو أن معدل الوفيات 
في الهند وروسيا وجنوب إفريقيا منخفض نسبيًا وفقاً للعدد الإجمالي للحالات. دعنا الآن نقارن 
العدد الإجمالي للحالات وإجمالي الوفيات‌في جميع هذه البلدان: 

fig = 6و‎ . "1112©0( 


۴10.2006۵606 (IO. BAF) 
x>daE al و۲۵۱۲‎ 
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177-032 ] "10831 Cases"], 
name='Total Cases’, 
marker color='indianred 
)) 
۴10.2006۵606 (IO BAE) 
و۲۵۱۲ ] 122 202<عر‎ 
۱19 طو ت9۵‎ Dean Sl, 
12716 ۲101۵1 Deaths’ , 
maz kes 6010 ۲ 11 0۳6 ENON 
0) 
۴1 . 1002۲6 layout )52221046- ' (45-حه 0162091 1 5 یوعد ,۲ دنرت 2ن‎ 


51070 . ۶10 
Total Cases‏ 11 
Total Deaths‏ ۷ 
600M‏ 
400M‏ 
200M‏ 
۲ 5 5 5 8 8 سا , 
جم 2 م © ° ۳3 2 0 3 2 
0 0 و 23 ج 3 9 ک 3 - 
ي 9 3 $ i‏ ا ”کي “كيه الك کی 
3 ی کي 3 


5 9 
8 2 
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دعونا الآن نلقي نظرة على النسبة المتوية لإجمالي الوفيات وإجمالي الحالات بين جميع البلدان 
التي بها آکبر عدد من حالات الإصابة بفيروس 05710-19©: 


#۳6۲668۲6296 OE Total Cases and Deaths 
cases = data["Total Cases"] .sum() 


deceased = data["Total Deaths"] .sumO 


129۵1 و‎ < ] Tocal 062908۲, 1و1‎ 161۳5۳ l 
values = [cases, deceased] 


fig = px.pie (data, values=values, names=labels, 
title='Percentage of Total Cases and Deaths', hole=0.5) 
۶1 0 . 51070 


تحلیل تثیرات 0۷14-19 باستخداه پیئون 


Percentage of Total Cases and Deaths 


Wl Total Cases 
9 Total Deaths 


فيما يلي كيفية حساب معدل الوفيات لحالات 00710-19: 


death rate = (data["Total Deaths"].sum() / data["Total 
062965 [ . 517 )(( 0 
اجه ) ادعام‎ REE مرت‎ CEM TES) 


Death Rate = +7 


عمود آخر مهمفي مجموعة البيانات هذه هو فهرس الصرامة (©12067 عصعوصتتاه). إنه مقياس 
مركب لمؤشرات الاستجابة. بمانی ذلك إغلاق المدارس وإغلاق أماكن العمل وحظر السفر. إنه 
يوضح مدى صرامة الدولني اتباع هذه الإجراءات للسيطرة على انتشار 005710-19 : 


۶10 = Dx Dat (data, Kx 00۵111۷۲, 0-2-5621 2525 | 


0 


| 12-2 لان ,۲5۵۴۵۱9121108۲ dala]‏ عدت 1 

color='Stringency 1۳06۲, height=400, 

EMELE دنا 180۵6 21252217 6ت"‎ COVA IIA) 
۶1 0 SINO 


هنا یمکننا أن نری أن الهند تؤدي أداءً جيداني مؤشر الصرامة آثناء تفشي فیروس کورونا. 


تحلیل تأثیرات 0711-19 على الاقتصاد 

دعنا الآن ننتقل لتحلیل آثار ٥٥۷14-19‏ على الاقتصاد. هناء نصيب الفرد من الناتج المحلي 
الاجمالي هو العامل الأساسي لتحلیل التباطو الاقتصادي الناجم عن تفشي 0۷10-19). دعونا 
نلقي نظرة على نصيب الفرد من الناتج المحلي الاجمالي قبل تفشي 007101-19 بين البلدان 
التي بها آکبر عدد من حالات الاصابة بفیروس :0070-19 


۶10 PX Dar )0218 , x> 00۵111۷7۲, ۷۶۱۲۵۲۵1 CASES, 
Revers dala ] ۲5۵0۱1۵6108۲, ۲1۵۵1 1۲62۳5 ۲ [ 


7 
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color='GDP Before 0607710", height=400, 
title="GDP Per Capita Before Covid-19”) 


۶1 0 . 51070 


GDP Per Capita Before 00۷۱-09 


GDP Before Covid 
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دعونا الآن نلقي نظرة على نصيب الفرد من الناتج المحلي الإجمالي خلال الارتفاعني حالات 
0010-9 : 
(dala, 5-6022, ۷۶۱۲۵۲۵1 6۵965 ,‏ 532 عزم — E10‏ 
Revere dalla ] ۲5۵0۱۲1۵6108۲, ۲1۵۵1 1۲626۳5 ۲1 ,‏ 
COlOE>GDE During 0۵0710۲, 630۳-400‏ 
Fer Capita 21021119 0۵710-197‏ طر1ق6 اجه ۲1 21 
51070 . ۶10 


GDP Per Capita During Covid-19 


GDP During Covid 
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الآن دعونا نقارن نصيب الفرد من الناتج المحلي الإجمالي قبل 0071-19 وأثناء - ٣0d‏ 
9 لإلقاء نظرة على تأثير 005710-19 على نصيب الفرد من الناتج المحلي الإجمالي: 


fig = (6ع©1112" . 60و‎ 
۴10.200 6۵06 (IO. BAE) 
2-033 ["Country"], 


۷۶02۲2 ] "62 Before Covid"], 
name='GDP Per Capita Before 005710-19“ , 


تحليل تأثيرات 601710-19 باستخدام بايثون 


1121۳ 16617 60101 ۲ 1۳01 EOE 
0) 
EG add 62362 (IO. BaF) 


۲/۵۱۲ ] 122 202<عر 

۷202۲2 ] عاط طلست‎ 111 COUTTS, 

۳۵1۲۵ ۲ 61 Per Capita During 0017710-19“ , 

1121۳ kes 6010 ۲ 11 0۳۲ 10۴ 
0) 
ادع‎ . 1۵02۲6 layout )27100 06۲ SEOUL, (45-حه 0162091 1 _ 5 یوعد‎ 
۶10 . 5۳070 


GDP Per Capita Before Covid-19‏ للا 
GDP Per Capita During Covid-19‏ ۷ 
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يمكنك أن تری انخفاضاني نصيب الفرد من الناتج المحلي الاجماليني جميع البلدان التي بها 
آکبر عدد من حالات الاصابة بفیروس کورونا. 


عامل اقتصادي مهم آخر هو مؤشر التنمية البشرية 12067 (Human Development‏ . إنه 
مؤشر إحصائي مركب لمتوسط العمر المتوقع والتعلیم ومؤشرات نصیب الفرد. دعونا نلقي نظرة 
على عدد البلدان التي كانت تنفق میزانیتها على التنمية البشرية: 


E E PS و‎ (Sala, هه ار ان كم‎ 
Rove 022 ] ۲5۵۴۱9۵121108۲, ۲۵621 Deal MSI | 
color='HDI', height=400 , 
title="Human Development Index during Covid-19”) 

۶1 0 . 51070 


, 


Human Development Index during Covid-19 
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إذن هذه هي الطريقة التي یمکننا بها تحليل انتشار 005710-19 وتأثيره على الاقتصاد. 


الملخص 

في هذه المهمة. درسنا انتشار فيروس كورونا بين الدول وتأثيره على الاقتصاد العالمي. لقد رأينا 
أن تفشى 005310-19 أدى إلى آکبر عدد من حالات الإصابة والوفيات بفيروس 60510-19© 
في الولايات المتحدة. أحد الأسباب الرئيسية وراء ذلك هو مؤشر الصرامةفي الولايات المتحدة. 
إنها منخفضة نسبيًا وفقًا لعدد السکان. قمنا أيضًا بتحليل كيفية تأثر نصيب الفرد من الناتج 
المحلي الاجمالي‌في كل بلد أثناء تفشي فيروس كورونا. آمل أن تكون قد أحببت هذه المقالة حول 
تحليل تأثيرات 0۷10-19) باستخدام بايثون. 


تحليل مدى الوصول إلى :125127212 باستخدام بايثون 


66) تحليل مدى الوصول إلى تصدعع2)كم1 باستخدام بايثون 
Instagram Reach Analysis using Python‏ 

يعد <ننهع 150 أحد أشهر تطبيقات الوسائط الاجتماعية اليوم. يستخدمه الأشخاص الذين 
يستخدمون هعموص بشكل احترافي للترويج لأعمالهم وبناء محفظة وتدوين وإنشاء أنواع 
مختلفة من المحتوى. نظرًا لأن هو تطبيق شائع يستخدمه ملايين الأشخاص من 
مختلف المجالات. فان 12563862027 يستمرفي التغيير لتحسين نفسه لمنشئي المحتوى 
والمستخدمين. ولكن مع استمرار هذا التغبیر. فإنه يؤثر على مدى وصول منشوراتنا التي تؤثر 
علينا على المدى الطويل. لذلك إذا أراد منشئ المحتوی أن يعمل بشكل جيد على 15568813111 
على المدى الطویل. فعليه أن ينظر إلى بيانات وصوله إلى 12563812332. هذا هو المكان الذي 
يأتي فيه استخدام علم البياناتفي وسائل التواصل الاجتماعي. إذا كنت تريد معرفة كيفية استخدام 
بيانات 11152813112 الخاصة بنا لمهمة تحليل الوصول إلى ۰105:0270 فهذه المقالة مناسبة 
لك.في هذه المقالة. سوف آخذك عبر تحليل الوصول الى 125628353 باستخدام بايثون. مما 
سيساعد منشئي المحتوى على فهم كيفية التكيف مع التغييراتفي 1256281212 على المدى 
الطويل. 


تحليل مدق الوصول إلى 1156222122 

لقد كنت أبحث عن الوصول إلى 111563873112 لفترة طويلة الآن.في كل مرة أنشر فيها على حساب 
2م الخاص بي» أقوم بجمع بيانات حول مدى وصول المنشور بعد أسبوع. يساعد ذلك 
في فهم كيفية عمل خوارزمية 1256381212. إذا كنت ترغبفي تحليل مدى وصول حساب 
3 الخاص بك. فيجب عليك جمع بياناتك يدويًا حيث توجد بعض واجهات برمجة 
التطبيقات ]۸۳ لكنها لا تعمل بشكل جيد. لذلك من الأفضل جمع بيانات 1050287010 يدويًا. 
إذا كنت طالبًاني علم البيانات وترغب‌ي تعلم تحليل الوصول إلى 1056287210 باستخدام بایشون 
فيمكنك استخدام البيانات التي جمعتها من حسابي على 1125]2812112. يمكنك تنزيل مجموعة 
البيانات التي استخدمتها لمهمة تحليل مدى الوصول إلى 1725628152127 من هنا. الآنفي القسم 
آدناه. سوف آخذك خلال مهمة تحليل الوصول إلى 10562873112 والتنبؤ باستخدام التعلم الآلي 
باستخدام بايثون. 


تحليل مدى الوصول إلى 112562812112 باستخدام بايثون 
لنبداً الآن مهمة تحليل مدى وصول حساب 17156381211 الخاص بي عن طريق استيراد مکتبات 
Python‏ ومجموعة البيانات اللازمة: 
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1۳001۲ pandas وه‎ 0 

311۳0۵0 MUMPY 2-5 NP 

1 وه ۰0۷۵10 1۵101011110 1۳001 

import 563201223 as 5 

1۳0011 0101۷ ۰. ۵201۵98 35 2۶ 

EE OM ۲۵15001 تا‎ COMSCORE ۲۷۲۵001 تا‎ 91301۲0۲ 

1 1012 60010106616101 01 

۶ اعل ۰.1۱۵ 9۳ مد ان‎ Select On NOOSE EAI EES یات‎ E 

۴01 51616810 . linear ۳00061 11001۲ ۳۵5517۲762۸0 ۲655 176۳569 EOS SOE 


Maem)‏ < ی راجت Bd ead‏ >= تاو 
print (data.head () )‏ 


Impressions From Home From Hashtags From Explore From Other Saves \ 
3920.0 2586.0 1028.0 619.0 56.@ 98.0 
2727.0 1838.0 1174. 
2085.0 1188.0 6 
2|616 621.0 932. 
1704.0 255.0 279. 


5394. 78.0 194.0 
533.0 41.0 


73.0 172.0 


4021. 
4528. 


wn © 


86 

8 

8 
2518.0 37.0 96.0 

Comments Shares Likes Profile Visits Follows \ 
5.8 5.0 8 25.6 2.6 
7.6 14.0 8 45.96 19.6 
11.6 1.6 0 62.0 12.6 
10.0 7.0 213.0 23.0 85.6 
5.6 4.6 8 8.0 0.0 


uN © 


Caption \ 
Here are some of the most important data visua... 
Here are some of the best data science project... 
Learn how to train a machine learning model an... 


Heres how you can write a Python program to d... 


© تا یم با د 


Plotting annotations while visualizing your da... 


Hashtags 
#finance #money #business #investing #investme... 
#healthcare #health #covid #data #datascience ... 
#data #datascience #dataanalysis #dataanalytic... 


#python #pythonprogramming #pythonprojects #py... 


© دا ده ساد 


#datavisualization #datascience #۹22۵ 


قبل البدءفي کل شیء دعنا نلقی نظرة على ما إذا كانت مجموعة البيانات هذه تحتوي على أي 
() تاو . () 15۳1011 . 0319 


Impressions 
From Home 
From Hashtags 
From Explore 
From Other 
Saves 
Comments 
Shares 

Likes 

Profile Visits 
Follows 


Caption 


یر مو هر مو مو مو مو مو مو مو امو امو امو 


Hashtags 
dtype: int64 


تحليل مدى الوصول إلى ۲۵۳ عهای"! باستخدام بايثون 


لذلك فهی تحتوي على قيمة فارغةفي كل عمود. دعنا نسقط كل هذه القيم الفارغة ونتحرك إلى 
أبعد من ذلك: 
data = 033. -6(‏ 
دعنا نلقي نظرة على رؤى الأعمدة لفهم نوع البيانات لجميع الأعمدة: 
() ۰.18۶0 18162 


<class 'pandas.core.frame.DataFrame' > 
Int64Index: 99 entries, @ to 8 


Data columns (total 13 columns): 


# Column Non-Null Count Dtype 

86 Impressions 99 non-null float64 
1 From Home 99 non-null float64 
2 From Hashtags 99 non-null float64 
3 From Explore 99 non-null float64 
4 From Other 99 non-null float64 
5 Saves 99 non-null float64 
6 Comments 99 non-null float64 
7 Shares 99 non-null float64 
8 Likes 99 non-null float64 
9 Profile Visits 99 non-null float64 
10 Follows 99 non-null float64 
11 Caption 99 non-null object 
12 Hashtags 99 non-null object 


dtypes: float64(11), object(2) 


memory usage: 10.8+ KB 


تحليل مدق وصول 12562522202 
لنبداً الآن بتحليل مدى وصول مشاركاتي على Instagram.‏ سألقي نظرة أولاً على توزيع 
الانطباعات (75551025م1172 01 2015651111012 التي تلقيتها من قسم الصفحة الرئيسية: 
.(home)‏ 
plt.figure (figsize= (10, 8))‏ 
plt.style.use ('"fivethirtyeight')‏ 
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Distribution of Impressions From Home 
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تظهر الانطباعات التي أحصل عليها من قسم الصفحة الرئيسية على :1725628721 مدى وصول 
مشاركاتي إلى متابعيني. بالنظر إلى الانطباعات من قسم الصفحة الرئيسية» يمكنني القول إنه من 
الصعب الوصول إلى كل متابعيني يوميًا. دعنا الآن نلقي نظرة على توزيع مرات الظهور التي تلقيتها 
من الو سوم :(hashtags)‏ 

plt.figure(figsize=(10, 8)) 


911.111 ) شيك 1ط‎ 125 051-52 OE IMOEESSEORNS EEOM (9۳۲205۳عظ‎ 
SRS . 415 9101 )0218 ] ۲ ۳08 25۳205 ۲[( 


1911 . 510170 


Distribution of Impressions From Hashtags 


0.0004 


0.0003 


Density 


0.0002 


0.0001 


14000 12000 10000 8000 6000 4000 2000 0 ووو 2009 


From Hashtags 


الوسوم هي أدوات نستخدمها لتصنيف منشوراتنا على 112562812112 حتى نتمكن من الوصول إلى 
المزيد من الأشخاص بناءً على نوع المحتوى الذي نقوم بإنشائه. يُظهر النظر إلى مرات ظهور 
علامة التصنيف أنه لا يمكن الوصول إلى جميع المنشورات باستخدام الوسوم. ولكن يمكن 
الوصول إلى العدید من المستخدمین الجدد من خلال الوسوم. دعنا الآن نلقي نظرة على توزیع 
مرات الظهور التي تلقیتها من قسم الاستکشاف Instagramq(explore section)‏ : 

plt.figure (figsize= (10, 8)) 


11 . ES Ele ) IDISEEIDUEION OE 118512955190115 EON EXOIOEE LN) 
525 . 41 5 6 6ن لام‎ (IAEA ۲ ۳۵0 ExXGlOEe ' | ( 


1911 . 510170 
Distribution of Impressions From Explore 
0.00175 
0.00150 


0.00125 


ity 


0.00100 


Densi 


0.00075 
0.00050 


0.00025 


3000 2500 2000 1500 1000 500 0 ی لیب 
From Explore‏ 
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قسم الاستكشاففي 1250268021 هو نظام التوصيةفي 125628222 .توصي المنشورات 
للمستخدمين بناءً على تفضيلاتهم واهتماماتهم. من خلال النظر إلى الانطباعات التي تلقيتها من 
قسم الاستكشاف. يمكنني القول أن 15087277 لا يوصى كثيرًا بمنشوراتنا للمستخدمين. تلقت 
بعض المشاركات وصولاً جيدًا من قسم الاستکشاف. لكنها لا تزال منخفضة جد مقارنةً بمدى 
الوصول الذي أتلقاه من الوسوم. 


دعنا الآن نلقي نظرة على النسبة المئوية للانطباعات التي أحصل عليها من مصادر مختلفة على 


:Instagram 


home = data ["From Home" [ .sum(O 


hashtags = data ["From ۳129۳205۲ [ .sum(O 


explore = data["From Explore"] .sum(O 
other = data["From Other"] . رتاو‎ 


labels 
values 


] ۲ سن ده‎ Hemel, Erom 22211205 | ۲ ۲1۵08 ۳۵۵1۵16۲, ۲۱0۵۲ [ 
[home, hashtags, explore, other] 


fig = px.pie (data, values=values, names=labels, 
title='Impressions on Instagram Posts From Various 
Sources', hole=0.5) 


۶1 0 . 5۳070 


Impressions on Instagram Posts From Various Sources 


لذا تظهر مخطط الدونات (106م 1012116) أعلاه أن ما يقرب من 50في المائة من مدى الوصول 
من مصادر أخرى. 
تحليل المحتوى 


الآن دعنا نحلل محتوى مشاركاتي على 1156281212. تحتوي مجموعة البيانات على عمودین؛ 
وهما التسمية التوضيحية (62000) والوسوم (12515285). والتي ستساعدناني فهم نوع 


المحتوى الذي أنشره على 11156281212 . 


110 علم البيانات: عن طريق الامثلة 


دعنا ننشیع سحابة الكلمات (۱0106101:1) لعمود التسمية التوضيحية لإلقاء نظرة على الكلمات 
الأكثر استخداماني التسمية التوضيحية لمشاركاتي على 105]2872122: 


O CE EE COE O)‏ ل (OE EOE‏ ره W‏ = ات ها 
stopwords = set (STOPWORDS)‏ 

wordcloud = WordCloud (stopwords=stopwords, 
20160 01380 601012۲۸۳1 6۳۲( Generale EEE) 

( ۲61295161 ) وتا , 51-۷716 .۰ 1911 

11 . ۴1 <م27 ۶1051 ) هیال‎ )12,10( ( 
plt.imshow (wordcloud, interpolation='bilinear') 
iE gE SHOE EW) 

plt.showO 


3 


gw Using: Python. 


2۲ تب 155 1106856۳ 


project 5 2 


۵22-5616۳662 


۴۷۱۵0۰ 6 St SC mode 1 


nany 


best; data:‏ تا ور ممننه» ؟ 


E 121 18 


ب 80311/51521028 165 96۲ 


neural network 


tıme 


الآنء دعنا ننشئ سحابة الكلمات لعمود الوسوم لإلقاء نظرة على الوسوم الأكثر استخدامافي 


: 1256281521 مشاركاتى على‎ 
EE د د‎ U 512101 EOC 1 IO ورن‎ ESE 26S) 
stopwords = set (STOPWORDS) 
wordcloud = WordCloud (stopwords=stopwords, 


2ت ) 2626 تت ورت 0 660 6010122۷۷۳1 ۲01780 0160 3 

111 . ۴1 <م2 ۶1051 ) هیال‎ )12,10( ( 
plt.imshow (wordcloud, interpolation='bilinear') 
DEALS GEE) 

plt.showO 


data datascience pythoncode art1f1c ıalıntellıgence 


amankharwal thecleverprogrammer 
.. 02123081۷515 dataanalytics m~ 


artifigialiptelligence ai machinelearning python 
سيل‎ ANE 0 لكل‎ 0۷۲۵۳۹82۲8 
92 2 086106163۲701۳08 ___ 
0۷۵۳۹۵۲ مممطع زم"‎ 0 5 
۵۱۵۵0۵1۷۲۸۶ 1+ 
“Dythonproject3” pythoncode ۰ 


deeplearning machinelearningprojects 121325 61 6066 5 
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تحليل العلاقات 
دعنا الآن نحلل العلاقات للعثور على أهم عوامل وصولنا إلى 105207077 سيساعدنا أيضافٍ فهم 
كيفية عمل خوارزميةدة 105262 . 


دعونا نلقي نظرة على العلاقة بين عدد الإعجابات وعدد مرات الانطباعات على مشاركاتي على 


: Instagram 


۴1 هنال‎ = ۶.50۵1۵ (data ۴12116 = dated, X> ۲1۵۲65 5 م17‎ 
قو كمسا ممق ميم را كن‎ ۲ 
title = "Relationship Between Likes and Impressions”) 

figure. show() 


Relationship Between Likes and Impressions 


Likes 


Impressions 


هناك علاقة خطية بين عدد الإعجابات ومدى الوصول الذي حصلت عليه على 1256281212 
دعنا الآن نرى العلاقة بين عدد التعليقات (01726265ح) وعدد مرات الانطباعات 
(11116551025) على مشاركاتي على125]2851221 : 


۴1 خفنو‎ < ۶.50۵1۲ (dala ۴12106 = dala, X>. ۲۳0۲65 5 م17‎ 
y="Comments", size="Comments", trendline="ols”, 
title = "Relationship Between Comments and Total 

Impressions”) 


figure. show() 


Relationship Between Comments and Total Impressions 


5k 10k 15k 


Impressions 
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يبدو أن عدد التعلیقات التی نتلقاها على إحدى المشارکات (02765:) لا يؤثرفي مدی وصولها. 
دعنا الآن نلقى نظرة على العلاقة بين عدد المشاركات وعدد مرات الظهور: 


۴1 ظت 59062 ا عدم = هنال‎ (data ۴12106 = dala, X> ۲10۲65 5 م17‎ 
y="Shares", size="Shares", trendline="ols”, 
title = "Relationship Between Shares and Total 

Impressions”) 


figure. showO 


Relationship Between Shares and Total Impressions 


shares 


5k 10k 15k 


Impressions 
سيؤدي عدد أكبر من المشاركات إلى وصول آعلی. لكن المشاركات لا تؤثر على مدى وصول‎ 
المنشور بقدر ما تؤثر إبداءات الإعجاب. دعنا الآن نلقى نظرة على العلاقة بين عدد مرات الحفظ‎ 
:)111165510115( وعدد مرات الانطیاعات‎ )535765( 
ها ۰69 ۶۰ < ها فط‎ (dala E SMe < صن د اون‎ 


="Saves", 5122۷92765۲۷, trendline="ols”, 
17 


title = "Relationship Between Post Saves and 1 
Impressions”, 


figure. show() 


Relationship Between Post Saves and Total Impressions 


Sk 10k 15k 


Impressions 
هناك علاقة خطية بين عدد المرات التي يتم فيها حفظ المنشور الخاص بي ومدى وصول منشور‎ 
ع5 الخاص بي. دعنا الآن نلقي نظرة على ارتباط جميع الأعمدة بعمود مرات‎ 


:(Impressions column) الانطباعات‎ 


تحليل مدى الوصول إلى 1056281312 باستخدام بايثون 


correlation = data.corr() 
BEIRE(EOEEE LE ELON ] ۲1۳۵1۴6991 085" [ , 50۲ 721169 ل ع و2)‎ NG > 825 


Impressions 10 
Likes 0.896277 
From Hashtags 0.892682 
Follows 0.804064 


Profile Visits 0.774393 


Saves 0.625600 
From Home 0.603378 
From Explore 0.498389 
Shares 0.476617 
From Other 0.429227 
Comments 0.247201 


Name: Impressions, dtype: float64 
لذلك يمكننا القول أن المزيد من الاعجابات والحفظ سيساعدكفي الوصول إلى المزيد على‎ 
مقع 5 سيساعدك العدد الأكبر من المشاركات أيضاف الوصول إلى المزيد. لكن العدد‎ 
المنخفض من المشاركات لن يؤثر على وصولك أيضًا.‎ 


تحليل معدل التحويل 

في 1256282112 . معدل المحادثة (726 00171526101) يعني عدد المتابعين الذين تحصل 
عليهم من عدد زيارات الملف الشخصي (715165 0201216 60621) من المنشور. الصيغة التي 
يمكنك استخدامها لحساب معدل التحويل هي (المتابعات / زيارات الملف الشخصي) * 100. 
الآن دعنا نلقي نظرة على معدل المحادثةفي حسابي على20ةع 10562 : 


4625625102 Fate > (data 511 50 5| SUNK) / 4۵172 ] ۲۵16 
VISES نا ما‎ E MOO 
PDE ARE )608۲7 619108 5252 


2 9 


لذا فإن معدل المحادثةفي حساب 175622351 الخاص بي هو 31/ وهو ما يبدو وكأنه معدل 
محادثة جيد جدا. دعونا نلقى نظرة على العلاقة بين إجمالى زيارات الملف الشخصی وعدد 
المتابعين المكتسبين من جميع زيارات الملف الشخصي: 


ECU = SEAL EEE (CACO 22 106 = 42237 ای تالا عط د‎ 
y="Follows", size="Follows", trendline="ols”, 
title = "Relationship Between Profile Visits and 

Followers Gained”) 

figure. showO 
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Relationship Between Profile Visits and Followers Gained 


العلاقة بين زيارات الملف الشخصى والمتابعين المكتسبة هى أيضًا علاقة خطية. 


نموذج توقع الوصول إلى تصدمع tیہ1‏ 


الآنفي هذا القسم. سأقوم بتدريب نموذج التعلم الآلي للتنبؤ بمدى وصول منشور على 
Instagram‏ دعنا نقسم البيانات إلى مجموعات تدريب واختبار قبل تدريب النموذج: 


م FEMALES‏ , تا LIES, Sewe,‏ ]] )امفيك دوك ك ير 
ND‏ سم نو VISES,‏ 22521 ۱ 
([" 1085و و1۳01 ۲ ] np.array (data‏ = ۷ 
و۷ مت لورت هه MERAN, les < Era‏ مرها هی يداه 
ze OA‏ م eS‏ 
random state=42)‏ 
gram‏ باستخدام بايثون: 


model = PassiveAggressiveRegressor() 


106621 ۴1 121ا)‎ 1, ۷191 ( 
۲۱۵061 . 56016 (xtest, ytest) 


3۳۳۵۱ ) ]18319 .5922441[( 


دعنا الآن نتوقع مدی وصول منشور على 111563812112 من خلال تقدیم مدخلات لنموذج التعلم 
الالی: 

۳۳۵6 525295" واه 3/9 | 11165" | ]| > 2269520265 

S7 2‏ كا 

features = RD . عطه‎ 257 )]]54۰0 TOS O ,9۰0 ,4۰0 ,233۰0 ,282.0[[(( 

1۱۵061 . 1603 6۲ (features) 


3۳۳3۷ ) ]19319 , 5922441[( 
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الملخص 

هذه هي الطريقة التي يمكنك بها تحلیل وتوقع مدی وصول منشورات 1256287212 باستخدام 
التعلم الآلي باستخدام بايثون .إذا أراد منشئ المحتوى أن يؤدي أداءً جیدا على :هع 10562 على 
المدى الطویل. فعليه إلقاء نظرة على بيانات وصوله إلى 15627270 .هذا هو المكان الذي پا 
فيه استخدام علم البيانات‌في وسائل التواصل الاجتماعي. آمل أن تكون قد أحببت هذه المقالة 
حول مهمة تحليل الوصول إلى 150227071 باستخدام بايثون. 


تحليل مراجعات مشاعر 110061 باستخدام بايثون 116 


7 تحليل مشاعر مراجعات ۰1102067 باستخدام بایئون 


Tinder Reviews Sentiment Analysis using Python 
امل" هو أحد أكثر تطبيقات (12108) المواعدة شيوعا. يربط الأشخاص الذين لديهم‎ 
اهتمامات ممائلة. للتحقق مما إذا كان 112067 يساعد الأشخاصف العثور على شرکاء یمکننا‎ 
600216 127 تحليل مشاعر الناس حول 1120617'. هناك الكثير من المراجعات على متجر‎ 
حول 112061'. يمكننا استخدام هذه البيانات لتحليل مشاعر مستخدمي 110067 . لذلك إذا‎ 
كنت تريد معرفة كيفية تحليل مراجعات ۲10467 فهذه المقالة مناسبة لك.في هذه المقالة. سوف‎ 

آخذك خلال مهمة مراجعة 1100167 لتحليل المشاعر باستخدام بايثون. 


تحليل مشاعر مراجعات 112061 ' باستخدام بايثون 


يتم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل آراء 110067" من ٥اععه).‏ تم جمعها 
من مراجعات 110067 على متجر 27[ 16ع600. دعنا الآن نستورد مكتبات بايثون ومجموعة 
البيانات اللازمة ليدء هذه المهمة: 


1۳0011۲ Pandas وه‎ 0 

1۳0011 1۵101011110.0۷۵ وه‎ 1 
from nltk.sentiment.vader import SentimentIntensityAnalyzer 
ETE ON 6 2 تا ۲۷۲۵2001 2 م15 6ت‎ 1 , 

هع 3 دع 2ع 26 0 06001 112 1 

IMPOSE E MI EKG 

import re 

626 121050122 كنات عدوت MEEK‏ ۶101 

1100011۲ 10 

data > 0.1620 ترفك‎ )۲1۳۴061۲ 00916 01۷ 6۷71 6175 ۰057 ( 
print )0212 . 620 )( ( 


reviewld userName \ 
@ gp:AOqpTOFSm-nY¥12XsKXOOIG-ZQtyvmjwKEp43ILLrhBS... Kreg Smith 
1 gp:AOqpTOFMaTJ6Mj -6hrp6ZI9gUSfzeVZQA9LugbFe1xR... ۰۷۰ 
2 . :عع‎ AOqpTOGtOLC4xZzUINTSt1ykvQHfOuhW7o0J0MScukLj... Benjo cantor 
3 :مي‎ ۸09 ۲0663:0225 1006/۷ ۳۷115 220۰ Chris Plata 
4 gp: ۸۵92۲062۸۵26۱1۱1 ۶011180 ۲۳6۴8607 483 لام‎ 51-۰ Dave Midas 

userImage \ 

@ https://play-lh.googleusercontent.com/a/AATXA1... 
1 https://play-lh.googleusercontent.com/a-/AOh14... 
2 https://play-lh.googleusercontent.com/a/AATXA1... 
3 https://play-lh.googleusercontent.com/a/AATXAJ... 
4 https://play-lh.googleusercontent.com/a-/AOh14... 

content score thumbsUpCount \ 
@ Got banned for life don't know why they won't ... 1 8 
1 I don't know why I was banned .. But I 5 not a... 2 6 
2 All gays even if your straight 1 AÛ A 1 e 
3 You have to pay so much to even be seen on thi... 3 8 
4 I do not understand how so many people use thi... 2 8 
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reviewCreatedVersion at replyContent repliodÃt 
٠. 11.6.1 2022-05-21 4:10 04 NaN NaN 
1 NaN 2022-05-21 4:4 NaN NaN 
2 13.6.1 2022-05-21 04:60:10 NaN NaN 
3 Nal 2022-05-21 8 NaN NaN 
4 1.6.1 2022-05-21 1+ NaN NaN 


في الانطباعات الأولى لمجموعة البيانات هذه» يمكنني رژية بعض القيم الخاليةفي بعض الأعمدة. 

لتحليل مراجعات 110067 نحتاج فقط إلى عمود المحتوى (01111212© 60266126). لذلك 
دعونا ننشى مجموعة بيانات جديدة مع عمود المحتوى ونتحرك إلى أبعد من ذلك: 

dJaea > متهن‎ | ۱۵۵۱۱۵ [ 

دعنا الآن نرى ما إذا كانت لدينا قيم خاليةفي عمود المحتوى: 

dala 151711 )( . 0 

يحتوي عمود المحتوی أيضًا على قيم خالية» فلنقم بازالة القیم الخالية والمضي قدمًا: 

data = data.dropna() 

دعنا الآن نجهز هذه البيانات لمهمة تحليل المشاعر (212:217515 5611113616). هنا يتعين علينا 


۲121۰ 001/۳۴1080 )۲ 500/0105۲ ( 
stemmer = .11م‎ 520173115 6۳۳6 ۲ ("english") 
stopword=set (stopwords.words ('english') ) 


def clean (text): 


text = str (text) .lowerO 

EEE > ج22‎ SNS FU 6 اعت‎ 

Ee)‏ م۲۲ wO,‏ 5 // :كه عا ') FE SUBD‏ دهع 

كدت م۲" م22۲۲ *.>۲) طناو .26 — EE‏ 

م۲۲ م (ظ30اهناتا6طا0 :110ل ضع 2 ) موم وه EE‏ 5 ۲ [55] ۲) طناك خط ح Cex‏ 
text)‏ 

bext - FE ")أ طناك‎ ١27 TT EES 

OE < تن‎ SUMO NONI, IT, EES) 

MOE AM‏ ۵0 1 (۲ ۲) ۵111و ۵۲۰ WOES EOE ۵0 AM‏ تاره 
| هم SEO‏ 

Lext=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' ')] 

text=" ". join (text) 

return texlL 
0212 ] 50229221 7| - data ۲۵۵۳۴۲۵۴۲۲ [ ۰2۳0۳01۲۷ (CLEAR) 


دعنا الآن نلقي نظرة على نوع الكلمات التي يستخدمها الأشخاص في مراجعات 110067 


راهان CEE‏ د ند EO‏ تا اه U U‏ < ادها 
stopwords = set (STOPWORDS)‏ 

wordcloud = WordCloud (stopwords=stopwords, 
120160 1 0صتا0‎ 60101۲۸۵1 Ee ( qene FaEe ) 212 
11 . ۴1 هیال‎ ) 212051262 )15 ,10( ( 

PLE حطه 1 001( 39 متا ۵1061) 0ظ و1‎ ۲ 3 11 06811 ۲( 
DAE AS SN OEE) 
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1911 . SHOW) 


ant 


4 


b0‏ 2 1 ا 52 تس 1 0 س 
82 د EO‏ - ووو اإس. 
7 سا 5 “6 با 
gg‏ ی کس ل Dp‏ 22 2 7 لحي 
= الف ” . use tinder‏ و Cs‏ 0 
prop 6‏ م new‏ لم ‏ - 8 #سا 
NORE tal reınstal U‏ ۱ ند ۶ da wor tg, WO 9P‏ نیس 
OF 3‏ 90 مد 
9 9 © ب به 0 2 ۶ ۴ 
DO: 3‏ 2 2ے 
: و 


5 5 2 9 مو‎ Dost ass 
۰۷۷۵ 51: 16: 6 app 


سأضیف الان ثلائة آعمدة أخرىني مجموعة البیانات هذه على آنها ايجابية "20516176 " وسلبية 


(sentiment scores) ومحايدة ۵0721" من خلال حساب درجات المشاعر‎ Negative" 


۳11, 00171۴1080 ) ۲۲۷۵06 16261 0081( 

sentiments = SentimentIntensityAnalyzer )( 

OL) ESOS EOE &‏ كت م COLA‏ ماع تسوا > EOS EN Vel‏ اه واه 
EM 02102 ] ۲۵۵۲۲۵۳۴۲۳۲ [‏ 

1 ۶0 | اوعض | (1) وعدهعو 9 0۵12171 61۳06065 68و] = [ ۲۱۲63۲1576۳ ] 0262 
| ۲۵۵۳۲۲۵۴۲۲1 ] 8212 1ل 

د FOE‏ تعسو ( دعم مك5 تا او هدر اهاعدا > وتا 9۳۲۱6 9اه 
| ۲۵۵۲۲۵۳۴۲۳۲ ] 0212 لكل 

data = data[ ["content", "Positive", "Negative", "Neutral"] [ 
print (data.head() ( 


content Positive Negative \ 


6 got ban life dont know wont tell help way read... 21 0.225 

1 dont know ban allow use tinder henceforth did... 0.371 0.108 

2 gay even straight 1 A 2 6.666 6.666 

3 pay much even seen app girl ever talk back bet... 0.229 90.128 

4 understand mani peopl use app im mean ugli ive... 6.666 0.225 
Neutral 

8 0.544 

1 0.521 

2 1.666 

3 0.642 

4 0.775 


دعنا الآن نلقي نظرة على نوع الكلمات التي يستخدمها الأشخاصفي التعليقات الإيجابية على 
:Tinder‏ 


OSES لح‎ TF OM lL EOS لد‎ TO 
datal content ۲[ [dalal ۲5۵91176۲ | > data [Negative l111) 


عله لبينات: عن طرية مد 


stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 

3 0160 ۲01780 6010122۷۷۳1 Eel) عد ره و‎ Ate (OOS E1 Ve) 
1011.۴1 01 ) ۶1051 <ع2‎ (L5, 10( ( 

PLE 11۳08101 ) 260 21611 0120, 3161001 1 دجم 313 ۲ حطم‎ ۲( 
ONE EES (OEE) 


1011 . 5100170 
en ۳۳ e x1 great good 
3 1 good great 
: 7 f look C 
¬ اند 8 بن پک‎ good nice 5 
8 سر 22کس‎ Say prcblen 0 مج‎ 
E ا سم‎ 209207 good Joye’: app 8 ( 5 
1 „tinder 200 0 
۳ ۱ back سد‎ 
ا د‎ , meet peopl 
5 بعت‎ E Pictu ) Lm 
E, 8 
١ ۳ کات‎ 3 1 
أ‎ @ ۲ ۱ best appre 3 2 : 
1 4. profil مم‎ 
2 ۱ ۳ im Person . 
: 3 saipe ^¬ © مت‎ app work 1ssu 0 \terest 


use 1 ۸۲ 2 6-9‏ ق 
i Super‏ 


م3 rte meet ;newNeWw RS§OP, 9 ۱ da te‏ 
دعنا الآن نلقي نظرة على نوع الکلمات ۳1 یستخدمها الأشخاصف المراجعات السلبية ل 
:Tinder‏ 


۲60210176 & ION EOE An 

0212 ] 'content'] [data['Negative'] > data["Positive"]1]]) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 

3 0160۲01780 601012۷1۷۳1 tel ( generale (REJA E ive) 

( (10, 15) <ع2 ۶1051 ) 01 1011.۴1 

plt.imshow (wordcloud, interpolation='bilinear') 
OER ) انلام رق‎ 

1011 . 5۳017 )( 


account: ban 
کارا‎ WO ۲ یت “5 ۵ 90 9 سای‎ Went 


fake ات‎ 


et Y8, سس مه‎ 

13 ۳9 
8 ك 
6 


keep crash custom 561711‏ 3 لعي 
كدت پس ۰ 5 8 
لاناع سس scan 6 ١‏ ِ 
went- 3-2 1 1 E k ۲ ۱ 0۵ E?‏ 
an account 2 axu al‏ 1 ع 8 30 phone number‏ رن 


1 


20-1635015 


١ cant 6۷60 ۴ let 
2۳ 
١ ت‎ Wast 3 ime 


120 تحليل مراجعات مشاعر 118067 باستخدام بايثون 


دعنا نلقي نظرة على النتيجة الاجمالية لمشاعر مستخدمي۲٥‏ 1104 : 


Sum )1212 ] ۲5۶۵9311776۳۲ [( 
sum (data ["Negative"]) 
sum (data ["Neutral"] ) 


x 


34 
2 


def Sentiment 52626 002 O, رت‎ 
1۶ (ط<ع)‎ and )2<0( : 
BERE CEOS ادو‎ 4 5 
11۶م‎ (Ba) aNd )<0( : 
print ("Negative 3) 
else: 


print ("Neutral 3 55 
sentiment_score (x, ,ملآ‎ 2( 


Neutral © 


لذلك يكتب معظم المستخدمين تعليقات محايدة. دعونا نلقي نظرة على إجمالي جميع درجات 
المشاعر: 
عد مت LESSEE‏ جل دشم 


19111 (Negative: 7 ۷( 
۱9222110 INeUEEAS 7) 


Positive: 158277.42200002735 
Negative: 59438.14199999961 
Neutral: 314250. 6 


كما ترى» الايجابي آکثر بکثیر من السلبي یمکننا القول إن معظم المستخدمین سعداء ب 
.Tinder‏ 


الملخص 

هذه هي الطريقة التي يمكنك بها تنفيذ مهمة 110067" تحليل مشاعر مراجعات 110067" 
باستخدام بايثون. هو أحد أكثر تطبيقات المواعدة شيوعًا. يربط الأشخاص الذين لديهم 
اهتمامات مماثلة. آمل أن تكون قد أحببت هذا المقال حول تحليل المراجعات‌ي 110067 


تحليل المشاعر لمراجعات 111101 باستخدام بايثون 121 


8 تحليل المشاعر لمراجعات 7۲:70 باستخدام 
بايثون TikTok Reviews Sentiment Analysis using‏ 
Python‏ 


يعد 111101" أحد أشهر تطبيقات الوسائط الاجتماعية اليوم. تشتهر بمقاطع الفيديو القصيرة 
الخاصة بها. غالبا ما يستخدم الأشخاص هذا التطبيق لمشاهدة مقاطع فيديو مسلية ومضحكة. 
على الرغم من محتواه الترفيهي» إلا أن هذا التطبيق لا يحبه الجميع. إذا تصفحت مراجعاته 
فستجد مزيجًا من الكراهية والدعم ل 111101'في جميع أنحاء العالم. لذلك. دعنا نحلل 
مراجعات 111۲01 لمعرفة ما يشعر به الناس حول محتوى هذا التطبيق.في هذه المقالة» سوف 
أطلعك على مهمة تحليل المشاعر لمراجعات 11161016 باستخدام بايثون. 


تحليل المشاعر لمراجعات ع1'01 111 ' باستخدام بايثون 

يتم تنزيل مجموعة البيانات التي أستخدمها هنا لمهمة مراجعات ٣k٣٠)‏ لتحليل المشاعر من 
ماعچهK.‏ تم جمعهاني الأصل من تقييمات 016 111 على متجر 7و1 6[ع600. يمكنك تنزيل 
مجموعة البيانات هذه من هنا. دعنا الآن نستورد مكتبات بايثون ومجموعة البيانات اللازمة لبدء 
هذه المهمة: 


1۳0011۲ Pandas وه‎ 0 

1 وه ۰.0۷۵10 1۵1010113110 1۳0011 

ELON ۵1۴0601 0اه‎ MOORE ۲۲۵۶001 تا‎ 9130۲۲05۲ 
1112 06001 010661۴611 01 

110001 MEE 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
۶101 11, COEOUS EMOOEE 00۵8و‎ 

1100011۲ 0 

import re 

۲121۰ 001۳۴1060 )۲ 5595560205 ( 

stemmer = nltk.SnowballStemmer ("english") 


CSV LENCE CSV)‏ ۱090 5 تاو 
print (data.head() )‏ 


reviewld userName \ 
@ gp:AOqpTOHRzZ-11c@apHLSKHHpS2FxUXsQS9Z88wP3sWc5... MR LOL GAMER 
1 gp:AOqpTOF6mFDEkIypmyT3shDLjPHg8SzB3kdns2W36ahp... Dino Kljako 
2 gp:AOqpTOGtqU4sbS8vuVo3-eB7kIXWoBn-OYCUZ1SnPRKS... Olivia Harding 
3 gp:AOqpTOFHDm-QaSR6jCpOGTFT2qr1_PKbCTbBNPahCEn. . . Keli We 
4 gp:AOqpTOFB6NdaoSIHRpOJRmbSknwMGxHcwYzux93YyX1I. .. Mavis Kotoka 
userImage ١ 
@ https://play-lh.googleusercontent.com/a/AATXAJ... 
1 https://play-lh.googleusercontent.com/a-/AOh14... 
2 https://play-lh.googleusercontent.com/a/AATXA1... 
3 https://play-lh.googleusercontent.com/a-/AOh14... 
4 https://play-lh.googleusercontent.com/a/AATXAJ... 


122 علم البيانات: عن طريق الامثلة 


content score thumbsUpCount \ 


8 Good 5 8 

1 Awesome app! Too many people on it where it's ... 5 

2 Not bad 5 6 

3 It is good 2 4 

4 Very interesting app 5 9 
reviewCreatedVersion at replyContent repliedAt 

8 23.8.4 2622-04-05 09 لادلا‎ NaN 

1 NaN 2022-04-05 1 NaN NaN 

2 23.9.5 2022-04-05 4 NaN NaN 

3 22.2.5 2022-04-05 4 NaN NaN 

4 22.1.5 2022-04-05 4 NaN NaN 


في الانطباعات (1500/6551005) الأولى لمجموعة البيانات هذه يمكنني رؤية قيم خاليةفي بعض 
الأعمدة. لتحليل تقييمات 11101 ۰ نحتاج فقط إلى عمودين ۰ المحتوى (0001601) والنتيجة 
‘(score)‏ لذلك دعونا ننشوع مجموعة بيانات جديدة مع هذين العمودين فقط ونتقدم خطوة 
أخرى من خلال تحليل آراء ۲:6۲01: 


02832 > 0212 ] ] ۳6۵۳۴۵۳۲, ۳50۵1۵۷ [ [ 
print (data.head () ) 


content score 
Good 5 
Awesome app! Too many people on it where it's ... 


Not bad 


Bun © 


5 
5 
It is good 2 
5 


Very interesting app 


دعنا الآن نرى ما ٍذا كان أي من هذين العمودين يحتوي على أي قيم فارغة: 
(OES 19۳81011 )( . 5۱5 )( (‏ ۱ 11 


content 3 
score 86 


dtype: ۵ 21564‏ 
تذلك هناك آربع قیم فارغةفي عمود المحتوی. دعنا نسقط القیم الفارغة ونتحرك آبعد من ذلك: 


data = data.dropna() 


دعنا الآن نجهز هذه البيانات لمهمة تحليل المشاعر. هنا يتعين علينا تنظيف النصفي عمود 
المحتوى: 


stopword=set ) 5 00170105 . 70205 ('english') ) 
def clean (text): 
text = str (text) .lower() 
ex _ 26 SUS, ۲, CED 
EEE > 26 . طناو‎ (IME EOS ALSTON STI, م۲‎ EE) 
text ES. SONS مر‎ ۲۲ EEE) 


تحليل المشاعر لمراجعات ۲11101 باستخدام بایئون 123 


ext - FE م۲ م (2622 211212 0212 . 110 2 ع 5 ) 250202 7 26 5 ۲ [55] ') طناك‎ 
text) 
tex re. SUD, ۲۲, tex) 
Tê < 26 SUMO 77 را ناك‎ E) 
ex - IUOES EOE ۵0 iM ۵۲۰ ۵111و‎ )۲ ۲( 1۶ ۵10 MOE AM 
stopword] 
Lext=" ". join (text) 
Lext = [stemmer.stem (word) for word in text.split(' ')] 
text=" ". join (text) 
return text 
0212 ] ۲۵۵۳۴۲۵۳۲۲ [ 2 data ۲۵۵۳۴۲۵۳۴۲۲ [ APO YE 1 32ت‎ 
دعنا الآن نلقى نظرة على النسب المتوية للتقييمات الممنوحة ل »01 1111" على متجر ع[002)‎ 
: Play 
۴2۲1009 = 4268 ] ۲5۹۵۵۲6۵۲ | value CSUNESO 
numbers = ratings.index 
quantity = ratings.values 
1۳0011 0101۷ ۰. ۵2001۵98 25 P< 
figure = 0۶۰016 (data, 
values=quantity , 
names=numbers, hole = 0.5) 
figure. 59070 
M5 
M1 
9 + 
9 3 
19 2 


يمكنك أن تری أن 75.7/ من المستخدمین قد أعطوا خمسة تقییمات ‏ ع1ه'1311' » و 712.1 


من المستخدمین صنفوها ب 1. الآن دعنا نلقي نظرة على نوع الکلمات التي یستخدمها 
المستخدمون‌ني مراجعات 111101 : 


Eos و ك‎ U 512101 ی‎ 1 AO CIEE 2652 ع‎ 20 
stopwords = set (STOPWORDS) 

17012000 ۲۲۵1۴ 001 0120 ) 5 0ط 5 > 1205 1760م 0ط‎ 21760105 , 
20160 ت01‎ eo loz whi tel J) Generale EERE) 
1911 . ۴1 <م2 ۶1051 ) هیال‎ )15 ,10( ( 
plt.imshow )170 206160110, interpolation='bilinear') 
PEE ASSIS EE) 


1 
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good 9 66 
TCE ۳ 1 
IL 1 


:8900 0 كت 


> 0 


Lee za -۱0[ love:‏ م 


۳1 0۷6 tiktokgreat= app ings 2990, NICE 


1911 . SROWO 


9 0 ويان [ سس 


good love 
app great , 


od 
1 
3 


1 ۷ 

سم 

le 

u 

8 

5 

8 - 

7۰۱ 07 
n 5 tıktok go 

19 : 

ل+١‎ 

O 

مم 

1 


app با(‎ 


problem 
nıce © 


با ۱۸ 


«tiktok team 


سا 4 


A 


سأضيف الآن ثلاثة أعمدة أخرىني مجموعة البيانات هذه على أنها إيجابية (©2051615) وسلبية 
(ع65دع116) ومحايدة )Neutr21(‏ من خلال حساب درجات المشاعر ( 56260116126 
5 للتغريدات: 


content Positive Negative ١ 


6 good 1.6 6.6 

1 awesom app mani peopl easier fb girl awesom gu... 0.381 6.6 

2 bad 6.066 1.8 

3 good 1.066 6.6 

4 interest app 0.750 6.6 
Neutral 

8 6.666 

1 0.619 

2 6.666 

3 6.666 

4 6.256 

دعنا الآن نلقي نظرة على نوع الكلمات التي يستخدمها الناسفي التعليقات الإيجابية على 


:[ 1 Tok 


EE Tove O0d :lovegood, good 


app ۱ ۱ 
love good 1 
think 
00 pp = 7 
)م‎ thing 
tıme 09 21 سس‎ 
a great ا 0 م‎ 10۷ 


N. best 


realli go o49 90 ` tiktok ni < + 00‏ 
نم 5 u el:‏ ۱ يت 
dd ± ۵‏ زر ات 
هط 2 ت لس see‏ ای 
دي :عد © = »2 ی 
أنه 5 كن 5 4 

لا ۵ س <« عد (I‏ دا 
t 1۳۹5 2 OU 2 1 ۳ thank 2‏ 
000 + سا 
1ê ¢ nice 19 ۱:۲5» 24] app, 2 ice‏ 3 


تحليل المشاعر لمراجعات 111101 باستخدام بايثون 


120 


دعنا الآن نلقي نظرة على نوع الکلمات التي یستخدمها الناس غالياني التعلیقات السلبية على 


:[ 1 1 1 


۲6021176 =1 ODI FOE 1T iM 

0212 ] ۲۵۵8۲۵۴۲ ۲[ [data['Negative'] > 42۵12 ] ۲5۵911576۲1 1[[( 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 

120160 1 0صتا0‎ 601012۲۸۸1 te.) generate ) 252962 ie) 
1911 . ۴1 هیال‎ ) 2255126-15 ,10( ( 

(۲ 06811 11 3 ۲ حوه 1 001( 319 متا ۵1061) 120211677 . 1 

عع :)1ه OE‏ 

1911 . 510170 


ad “O1 ا ر‎ fol low 
le) give 
O 


7 وت‎ SO ban 1. peop ۱3 
وغة‎ 9 1 f 


mak e ۷ ونر‎ 


هي الطريقة التي يمكننا بها تحليل مشاعر مراجعات ۲K ٣٥۴‏ باستخدام لغة برمجة بايثون. 


الملخص 


إذن هذه هي كيفية تحليل مشاعر مراجعات 1111012 . تشتهر کلم 1111 بمقاطع الفيديو 
القصيرة الخاصة بها. غالبا ما يستخدم الأشخاص هذا التطبيق لمشاهدة مقاطع فيديو مسلية 
ومضحكة. على الرغم من محتواه الترفيهي, إلا أن هذا التطبيق لا يحبه الجميع. آمل أن تكون قد 


أحببت هذه المقالة حول تحليل مشاعر مراجعات 11161016 باستخدام بايثون. 


تحليل مشاعر حرب أوكرانيا وروسيا على تويتر باستخدام بايثون ۱۳۵ 


9) تحليل مشاعر حرب أوكرانيا وروسيا على تويتر 
باستخدام بایئون Ukraine Russia War ' Twitter‏ 
Sentiment Analysis using Python‏ 


اليوم هو اليوم التاسع عشر للحرب بين روسيا وأوكرانيا. تدعم العديد من الدول أوكرانيا من 
خلال فرض عقوبات اقتصادية على روسيا. هناك الكثير من التغريدات حول حرب أوكرانيا 
وروسيا حيث يميل الناس إلى تحديث الحقائق على الأرضء وما يشعرون به حيال ذلك. ومن 
يدعمون. لذلك إذا كنت ترغبفي تحليل مشاعر الناس بشأن الحربفي أوكرانيا وروسياء فهذا 
المقال مناسب لك.في هذه المقالة, سأطلعك على مهمة تحليل مشاعر الحربفي أوكرانيا وروسيا 


على تويتر باستخدام لغة بايثون. 


تحليل معنويات حرب أوكرانيا وروسيا على تويتر باستخدام بايثون 

يتم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل المشاعر على 1071667 بشأن حرب 
أوكرانيا وروسيا من 1622216 تم جمع مجموعة البيانات هذهفي البداية من 15716661 ويتم 
تحديثها بانتظام. يمكنك تنزيل مجموعة البيانات هذه من هنا. دعنا الآن نستورد مكتبات بايثون 
ومجموعة البيانات اللازمة للبدء بهذه المهمة: 


1۳0011۲ Candas وج‎ 0 

import seaborn as 5 

1 وه ۰0۷۵101۲ 1۵101011110 1۳001 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
۶1018 ۲۵۴0601 0اه‎ MOORE ۲۲۵5001 تا‎ SIOEVWORDS, 

1 112 06001 010661 6۳11 0 

11۳0010 21 1 

import re 

۶101 NICK. COEOUS EMOOEE 00۵9و‎ 

11۳001۲ 10 


02162 < 0.16۵0 CSV) 


id conversation_id created_at date time ١ 
@ 1.502530e+18 1.502260e+18 2022-03-12 06:03:14 UTC 3/12/2022 4 
1 1.50253@0e+18 1.502530e+18 2022-03-12 06:03:14 UTC 3/12/2022 4 
2 1.502530e+18 1.502530e+18 2022-03-12 06:03:13 UTC 3/12/2022 6:3 
3( 8 1.502210e+18 2622-63-12 06:03:12 UTC 3/12/2022 2 
4 2+58 1.500440e+18 2622-63-12 66:63:12 UTC 3/12/2022 2 
timezone user_id username ١ 
@ 2.019880e+07 redcelia 
2.275356e+08 eee_eff 


86 
6© 1+7 145*3۴۷7 
6 9.8986206+717 reallivinghuman 
9 1.164940e+18 rpcsas 


> wn شر‎ © 
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name place ... geo source user_rt_id \ 


6 Johnson Outua Eurrar 0 5 #NeverVoteTory NaN ... NaN NaN NaN 

1 Wearing Masks still saves lives UAMC » + NaN ... NaN NaN NaN 

2 Brian NaN ... NaN NaN NaN 

3 Basha NaN ... NaN NaN NaN 

4 RonJon NaN ... NaN NaN NaN 
user_rt retweet_id reply_to \ 

8 NaN NaN [{'screen_name': 'RussianEmbassy', 'name': 'Ru... 

1 NaN NaN [1] 

2 NaN NaN [1] 

3 NaN NaN ([{'screen_name': 'RussianEmbassy', 'name': 'Ru... 

4 NaN NaN ([{'screen_name': 'IsraeliPM', 'name': 'Prime M... 

retweet_date translate trans_src trans_dest 

8 NaN NaN NaN NaN 

1 NaN NaN NaN NaN 

2 لادلا‎ NaN NaN NaN 

3 NaN NaN NaN NaN 

NaN NaN NaN NaN 


دعونا نلقي نظرة سريعة على جميع أسماء الأعمدة لمجموعة البيانات: 
CO 2‏ 122 02) ظ 911 


10067 )] ۲39" ر‎ 'conversation_id', "6۳۵۵۶۵۵ 3*۲ و‎ 'date', 'time', 'timezone', 
'user_id', 'username', 'name', 'place', 'tweet', 'language', 'mentions', 
'urls', 'photos', 'replies_count', 'retweets_count', 'likes_count', 
'hashtags', 'cashtags', 'link', 'retweet', 'quote_url', 'video', 
'thumbnail', 'near', 'geo', 'source', 'user_rt_id', 'user_rt', 
'retweet_id', 'reply_to', 'retweet_date', 'translate', 'trans_src', 
'trans_dest'], 


dtype='object') 
نحتاج فقط إلى ثلاثة أعمدة لهذه المهمة (اسم المستخدم (015672212) والتغريدة (6ع6776)‎ 
واللغة (ع12251138))؛ سأختار فقط هذه الأعمدة وأمضى قدمًا:‎ 
data = data ] ["username", "tweet", "language"] | 
دعنا نلقي نظرة على ما إذا كان أي من هذه الأعمدة يحتوي على أي قيم فارغة أم لا:‎ 
data 2 ناض‎ OSU) 


username 8 
tweet 8 
language 86 
dtype: int64 


لذلك لا يحتوي أي من الأعمدة على قيم فارغة» فلنلق نظرة سريعة على عدد التغريدات التي يتم 
نشرها بأي لغة: 


0262 ] ۲1۵۱010296۳1 . value 6632-50 


128 تحليل مشاعر حرب أوكرانيا وروسيا على تويتر باستخدام بايثون 


en 8812 
pt 251 
und 198 
it 155 
in 122 
ru 85 
hi 55 
ja 52 
es 40 
ta 23 
tr 19 
ca 18 
۴۴ 16 
et 16 
t1 15 
nl 14 
de 13 
1م‎ 13 
28 9 
ar 9 
zh 9 
sv 6 
uk 6 
te 6 
mr 5 
cs 4 
el 4 
gu 4 
no 3 
th 3 
kn 3 
ro 3 
ur 2 
or 2 
eu 2 
ko 2 
ht 2 
s1 2 
bn 1 
cy 1 
ne 1 


Name: language, dtype: int64 
لذا فإن معظم التغريدات باللغة الإنجليزية. دعنا نجهز هذه البيانات لمهمة تحليل المشاعر. سأقوم‎ 
هنا بإزالة جميع الروابط وعلامات الترقيم والرموز وأخطاء اللغة الأخرى من التغريدات:‎ 


۲11۰ 001/۳۴1020 )۲ 500/0۵105۲ ( 
stemmer = .11م‎ 51012 1 1 56۳۳6 ۲ ("english") 
stopword=set (stopwords.words ('english') ) 


def clean (text): 


text = str (text) .lowerO 
E & کت‎ SONIC, 557 ES 
tex - 26 . را 5|051 //: - 11525" ) طناو‎ Ee 
)نات 25 - اندتعا‎ ۰ 2227957 O, Ce 
( 


text = re.sub(' ]55[' 5 re.escape (string.punctuation), '', 
text) 


میت عن طرية مد 


text - re. م۲۲ (ر'ضا') تاو‎ text) 

NONE, 7 E)‏ ۱ات = کات تا 

WOES NOE IM‏ 12 (' ') 911و EOE WOES iN EeXE‏ 2620| - تاره 
stopword]‏ 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

text=" ". join (text) 

return text 
data ["tweet"] = data["tweet"] .apply (clean) 


دعنا الآن نلقي نظرة على سحابة الكلمات u(‏ ٥1ء۲٥‏ »)في التغریدات. والتي ستظهر الكلمات 
الأكثر استخدامّاني التغريدات من قبل الأشخاص الذين يشاركون مشاعرهم والتحديثات حول 
حرب أوكرانيا وروسيا: 


textê - ۲ "6232 1 EOE 1 iN 0212 6752 5( 
stopwords = set (STOPWORDS) 
wordcloud = WordCloud (stopwords=stopwords, 


20160 0180 601012۲۸۵1 Eel) عدت ع ان‎ ALE EERE) 
1911 . ۴1 كه ۶1051 ) هیال‎ )15 ,10( ( 

( 06611۲ 11 3 ۲ حوه 11 001(ه 319 متا 2611 060 ) 0ظ فص . ع 1 
عون SK‏ تدای و سا 18 


1911 . 51070 


usa 1316۳۳۲ back. ا‎ 
AHR 
ukraine tan 
2 621 war و زو ل‎ 
“م510‎ ltr ump د‎ ¬ 


use 


O 18 , War 


ات ١ wanî‏ 
و۵۸۷9 Nato‏ سک مجع 


سأضیف الان ثلائة أعمدة أخرىني مجموعة البیانات هذه على آنها إيجابية (©2051615) وسلبية 
(265ع116) ومحايدة )Neutra1(‏ من خلال حساب درجات المشاعر ( 56261116126 
65 للتغریدات: 


pn. 


۲۳ ۸8 0 


علد 


still 


۳11: 010171۴1060 ) ader 16261 0081( 
sentiments = SentimentIntensityAnalyzer() 


كك BOS EOE‏ ار SPOOLS TEY SEOEES‏ هیا < الأ نوناد EOS‏ 9 و6 

in data ["tweet"] ] 

02۲06 ] Neale vel << N SERE MEME SOLA EE 0069و‎ )1( ] ۲۴۵9۲ [ Kor 1 

in data ] ۲۲۷۵۵۱۲۳ [ [ 

EO 1‏ ات ی ار SCEOLES‏ 20817 1ت امور وا ات وا = وتات ۱۳۱6 ده 
1 


in data ["tweet" ] 


130 تحليل مشاعر حرب أوكرانيا وروسيا على تويتر باستخدام بايثون 


data = 02102 ] ["tweet", "Positive", "Negative", "Neutral"] ] 
print (data.head () ) 


tweet Positive Negative \ 


@ russianembassi ft mfarussia jeffdsach csdcolum... 9.077 6.24 
1 kidnap without charg access lawyer putin ۰ 9.000 6.666 
2 much western civil everyon feel compel find cr... 0.144 0.259 
3 russianembassi love place ill visit sure next ... 0.291 0.126 
4 israelipm iaeaorg didnt know state israel advi... 6.68 6.666 
Neutral 
6 6.69 
1 1.8 
2 6556 
3 20553 
4 1.000 
3 72 4 ءا ماس ما اس‎ ۰ 
دعنا الآن نلقی نظرة على الکلمات الاکفر شيوعًا التی يستخدمها الأشخاص ذوو المشاعر‎ 
الایجابية:‎ 
10۵5311176 = ۲ ONAN EOE د‎ To 4212 ] ۲۳۷/۵۵۲۲ [ OES ] ۲5۵53 ۲17۲76 ۲[ 
> 0212 ] ۲۲۵0211576۳۲11 [( 


stopwords = set (STOPWORDS) 
wordcloud = WordCloud (stopwords=stopwords, 

3 0160۲01180 6010122۳۷۳1 tel) generale (POSTE Ve) 
1011.۴1 011 ) ۶1051 <ع2‎ )15 ,10( ( 
plt.imshow (wordcloud, interpolation='bilinear') 
OE ARTS 5 (ر ع‎ 


1911 . SROWO 


اع الام 


3 ۲-0 1۳ 2 


Count | 1 think peopl‏ 6 بم. 


6011089 50011 جه 5 


5 | 5 a 
say Î اس‎ 8 

2 ck : DO° ê war 000 1 “مانا‎ make 4 ۶ 
7 یلا۳‎ Jone 


10 1لا لاک world‏ 


israel 
دعنا الآن نلقى نظرة على الكلمات الا كثر شيوعًا التى يستخدمها الأشخاص ذوو المشاعر السلبية:‎ 


negative =' '.join([i for i in data['tweet'] [data ] ۲۱۲۵0211776 ۲ [ 
< 0212 ] 26552612 II) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 

3 0160۲01180 6010122۷۷۳1 EE) SICREEFAEE (REISE VE) 
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1011.۴1 011 ) ۶1051 <ع2‎ )15 ,10( ( 
plt.imshow (wordcloud, interpolation='bilinear') 
OE GASH SN LO EE) 


plt.showO 
TY ات‎ happen need E: must 
peop 5 لم. 51د‎ 
7 2P لا‎ Ca 5 çÇ come بدا‎ 
nedia 0 bar . دعلة‎ 
let nat الا زے‎ ukrain war war نا‎ r3 
west ۳ ۹ fight د سم‎ 


ropaganda 


(sn 
ide think r, 


1 1 

۳09 101 ب‎ WOFLQd E 
ج‎ g80: 016 £ ‘Wa FEDA 

ekilleucepwar russia trp China ۲۴ sanction‏ ا 
هذه هي الطريقة + التي يمكتك بها تحليل مشاعر الناس بشأن حرب أوكرانيا وروسيا. آمل أن تنتهى 
هذه الحرب قريب وأن تعود الأمور إلى طبيعتها 
الملخص 
هناك الكثير من التغريدات حول حرب أوكرانيا وروسيا حيث يميل الناس إلى تحديث الحقائق 
على الأرض» وما يشعرون به حيال ذلك. ومن يدعمون. لقد استخدمت هذه التغريداتفي مهمة 
تحليل المشاعر على تويتر بشأن حرب أوكرانيا وروسيا. 


اج 


- 


تحلیل مشاعر مراجعات ]۲101627۳ باستخدام بایئون 132 


0 تحلیل مشاعر مراجعات Flipkart‏ باستخدام بایئون 
Flipkart Reviews Sentiment Analysis using Python‏ 
)ما۴ هي واحدة من آشهر الشركات الهندية. إنها منصة للتجارة الإلكترونية تتنافس مع 
منصات التجارة الإلكترونية الشهيرة مثل ۰۸۵207 واحدة من أكثر حالات استخدام علم 
البيانات شيوعًا هي مهمة تحليل المشاعر لمراجعات المنتجات المباعة على منصات التجارة 
الإلكترونية. لذلك. إذا كنت تريد معرفة كيفية تحليل مشاعر مراجعات ۰۳11176 فهذه المقالة 
مناسبة لك. في هذه المقالة» سوف أطلعك على مهمة 1م111 لمراجعة تحليل المشاعر 
باستخدام بايثون. 


تحليل مشاعر مراجعات ۳3016276 باستخدام بايثون 


يتم تنزيل مجموعة البيانات التي أستخدمها هنا لتحليل المشاعر لمراجعات ۳1116876 من 
عاعع2.. لنبدأ هذه المهمة عن طريق استيراد مكتبات بايثون ومجموعة البيانات الضرورية: 


1۳0011۲ Candas وه‎ 0 

import 5632012123 as 5 

ای aS‏ ان سر وا رن MAES‏ ان الل 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
ELON 65200 1ت‎ MOORE تا لك كل‎ SEOEVWORDS, 

1112 06001 010661611 01 


data = 

pd.read csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/flipkart_ reviews.csv") 

print (data.head() ( 


Product_name ... Rating 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... ... 5 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... ... 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... ... 
DELL Inspiron Athlon Dual Core 3050U - (4 GB/2... ... 
DELL Inspiron Athlon Dual Core 36560 - (4 GB/2... ... 


© هرابم س د 
صا صا صا صا 


[5 rows x 3 columns] 
تحتوي مجموعة البيانات هذه على ثلاثة أعمدة فقط. دعنا نلقي نظرة على ما إذا كان أي من هذه‎ 
الأعمدة يحتوي على قيم مفقودة أم لا:‎ 
EME OEE SULLY sS) 
Product_name 86 
Review 86 


Rating 8 
dtype: : 64 


علم البیانات: عن طريق الامثلة 133 


لذلك لا تحتوي مجموعة البیانات على أي قیم فارغة. نظرًا لأن هذه هي مهمة تحلیل المشاعر 
لمراجعات126م1:11 . فسوف آقوم بتنظیف وإعداد العمود الذي يحتوي على المراجعات قبل 
لتوجه إلى تحلیل المشاعر: 


110001 RES 

import re 

۲121. 001۳۴1020 )۲ 500/0105۲ ( 

stemmer = nltk.SnowballStemmer ("english") 
EE OM 11, كنات عدوت‎ APOE SIEOPWOEIS 

1100011۲ 10 

stopword=set (stopwords.words ) ۲6۴013 51( ( 


06۶ clean (text): 


text = str (text) .lowerO 

EERE - FE SUDO, TT EOS 

Cex < Te طتاو‎ DEEDS 17 WO, م۲۲‎ eC) 

EE = AS SNS 2221157 "7 ریا‎ 

text = re.sub(' ]55[' 5 re.escape (string.punctuation), '', 
1 6261 ( 

Eel‏ ۲۲۸ 1 طلاو . 26 - دهع 

ع8 م۲۲ ۲۱*۱۵۲ ) SUD‏ . ۲۵ ع text‏ 

ام EOE WOES IAN ۲۵۲۰ 5۵111 )۲ ۲( E WOES‏ 0026| - تاره 
stopword]‏ 

Lext=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' ')] 

tLext=" ". join (text) 

16 تا‎ 22 2 
data["Review"] = 022 ] ۲۶۹۵۲16۷۲ [ .apply (clean) 


تحلیل المشاعر لمراجعات]0127 :۳1 

يحتوي عمود التصنیف (00111010 1301:8) الخاص بالبیانات على التصنیفات التي قدمها کل 
مراجع. لذلك دعونا نلقي نظرة على كيفية قیام معظم الأشخاص بتقييم المنتجات التي یشترونها 
من Flipkart‏ : 


0212 ] Rating |. value 265025-50 
numbers = ratings.index 
quantity = ratings.values 


12 15 


1۳0011 0101۷ ۰. 201۵98 و2‎ 2۶ 
figure = 0۶۰,016 (data, 
values=quantity, 
names=numbers, hole = 0.5) 
figure. 9900 


134 تحليل مشاعر مراجعات 1216م 111 باستخدام بایئون 


لذلك منح 60 / من المراجعین 5 من صل 5 تقییمات للمنتجات التي يشترونها من ٤۲)منا۴‏ 
دعونا الآن نلقي نظرة على نوع التعلیقات التي يتركها الأشخاص. لهذا؛ سأستخدم سحابة 
الکلمات (6101:0 7070) لتصویر الکلمات الا کثر استخدامًاني عمود المراجعات : 


text جح‎ ۲ "6232101 EOE 1 iN 02 52 . 1671 617( 
stopwords = set (STOPWORDS) 
wordcloud = WordCloud (stopwords=stopwords , 

3 010۲01780 COO IRE . 96۴۵106 ) EC 
111 . ۴1 <م2 ۶1051 ) هیال‎ )15 ,10( ( 
plt.imshow )170 206160110, interpolation='bilinear') 


هت عالت 
510170 . 1911 
ERO ¢ ,‏ وير ۵ > 
1@product‏ 2 


3 پچ د + 3 as‏ ۳ لسم 
well 3 0 g1‏ سم 
یه 
O ۳ design Ke lz: © screen‏ 
A‏ © كلك Work OOK:‏ ع 
goad, prOfUSh. pict ur qualit 2‏ 
money;‏ ۷۵1 ۱1 6 01 ات 
NICE:‏ 1 
n 8‏ ۱ 


١166 product 8 


5 ه66 0 


monitor better? : thank realli featur ل‎ 1Se: 


١ 
۲ good 


hour 


8 


۱۳ qualiti 


thank flipkart 


سأقوم الآن بتحليل مشاعر مراجعات 111016076 عن طريق إضافة ثلاثة أعمدةفي مجموعة البيانات 

هذه على أنها إيجابية (205165) وسلبية (ع265ع716) ومحايدة (1621اء271) من خلال 
حساب درجات المشاعر (50015©5 561261116116) للمراجعات: 

۳11, download ( vader 16261 eon!) 

sentiments = SentimentIntensityAnalyzer(O 


daca ۱ EOSIEA ve | - له | زرد كم ارو مهوت‎ | EOE & 
in data ["Review"] [ 


علم البيانات: عن طريق الامثلة 


> SERE MEME رت ده را مهالوم نه‎ neg Eo 


اد سا 


Neural | [ 


Sene 11 هد 9۱ ۵1 . وا‎ CE ERED 


"Negative", 


"1 


0212 ] "102317" [ 
in data ["Review" 
data ["Neutral" |] 


in data ["Review"] |] 


data = data ] ["Review", "Positive", 


print (data.head() ) 


Review ... Neutral 

@ best great performancei got around backup bi... ... 6.54 
1 good perfom ... 0.256 
2 great perform usual also game laptop issu batt... ... 0.723 
3 wife happi best product O 0.488 
4 light weight laptop new amaz featur batteri li... ... 1.000 
[5 rows x 4 columns] 

x = sum (data ["Positive"]) 

y = sum (data ["Negative"] ) 

2 < SUM 018152 ] MeUEEAL ۲[( 

درا مها معا ممه لسع 1ب ضعه de‏ 


(2<0) 23210 (إطعة) 1۶ 


11 1 ) ۵ ۵ 1۷ 


(Da) 208 (BC):‏ 131۶ه 


print ("Negative ل‎ 


else: 


print ("Neutral 0 اللا‎ 
2118618 5601۳6 27 ۷۶ 2( 


sen 


Neutral @ 


لذا فإن معظم المراجعات محايدة. دعنا نلقي نظرة على إجمالي درجات المشاعر الإيجابية 
والسلبية والحيادية للعثور على نتيجة حول تقييمات ٩۲۲‏ )م:ا۴ : 


الملخص 


د رت VE‏ 1ع لك 8 ) 192221106 
Negative: ۳۲, Vv)‏ ) 1911 
)= رت 2212 6ن 212 ) OE E‏ 


Positive: 923,999 5 
Negative: 13 
Neutral: 1283.68s0000000006 


لذلك» يعطي معظم الأشخاص مراجعات محايدة وتقدم نسبة صغيرة من الأشخاص مراجعات 
سلبية. لذلك یمکننا القول إن الناس راضون عن منتجات وخدمات 1231م111. آمل أن تكون قد 
أحببت هذا المقال حول تحليل المشاعر ل 111012256 باستخدام بايثون. 


تحليل المشاعر تجاه لقاح فايزر باستخدام بايثون 0 


الم 
درع 


1 تحليل المشاعر تجاه لقاح فايزر باستخدام بایئون 
Pfizer Vaccine Sentiment Analysis using Python‏ 


يعد ۲۷/1667 أحد أكثر تطبيقات الوسائط الاجتماعية شيوعًا حيث يتمتع الأشخاص بحرية 
مشاركة آرائهم حول أي موضوع. هناك العديد من التغريدات المسجلة حول التوعية بلقاح فايزر 
(Pfizer vaccine)‏ والتي يمكن استخدامها لتحليل مشاعر الناس حول لقاح فايزر. لذلك. إذا 
كنت تريد معرفة كيفية استخدام مجموعة بيانات 710067 لتحليل المشاعر فهذه المقالة مناسبة 
لك.في هذه المقالةه سوف أطلعك على مهمة تحليل المشاعر تجاه لقاح ۳626۴ باستخدام 


بايثون. 


تحليل المشاعر تجاه لقاح فايزر باستخدام بايثون 

يتم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل المشاعر تجاه لقاح ۳826۲ من 
عم والتي تم جمعهاني البداية من 15716667' عندما كان الأشخاص يشاركون آرائهم حول 
لقاح 6261. لنبدأ مهمة تحليل المشاعر تجاه لقاح 28261 عن طريق استيراد مكتبات بايثون 


1۳001۲ Pandas وه‎ 0 

import seaborn as 585 

1 وه ۰.۳۷۵10 1۵1010113110 1۳0011 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
EF OI 60 221 يات لعل م 22 156 6ت‎ 1 , 

1 112 06001 010661۴6۳11 01 


data = 

pd.read csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/vaccination_tweets.csv") 

print (data.head() ( 


id user_name ... favorites is_retweet 
© 6 Rachel Roh ... 6 False 
1 8 3 Albert Fong ... 3 False 
2 3 elitrUd ... 6 False 
31 7 Charles Adler ... 2129 False 
4 1337854064604966912 Citizen News Channel ... e False 


[5 rows x 16 columns] 


لذا فإن مجموعة البيانات هذه كبيرة جدء دعنا نلقي نظرة على ما إذا كانت تحتوي على أي قيم 


data.isnull )( .sumO 


id 6 
user_name 6 
user_location 1636 
user_description 506 
user_created 6 
user_followers 86 
user_friends 6 
user_favourites e 
user_verified 6 
date 8 
text 

hashtags 1949 
source 1 
retweets 86 
favorites 8 
is_retweet e 


dtype: int64 


على الرغم من أن هذه القيم الخالية لن تؤثر على مهمة تحليل المشاعرء للحفاظ على بساطة 
الأمور» سأقوم بإسقاط الصفوف التي تحتوي على قيم خالية لأن مجموعة البيانات كبيرة بالفعل: 


data = 0233.60 


id user_followers ... retweets favorites 
count 4.749000e+03 4.749000e+03 ... 4749.000000 4749.000000 
mean 1.355333e+18 5.069683e+04 ... 1.545378 9.385555 
std 1.280104e+16 3.545440e+05 ... 13.395572 55.280915 
min 1.337728e+18 66+ع6.666666‎ ... 6. 666666 6. 06660666 
25% 1.344929e+18 1.740000e+02 ... 6. 066666 6. 000666 
50% 1.352030e+18 6.480000e+02 ... ۰9999 1. 0 
75% 1.364940e+18 2.728000e+03 ... 1-9999 5 . 0006068 
max 1.384788e+18 1.371493e+07 ... 678.000000 0 


[8 rows x 6 columns] 


يعد عمود النص «صصای (text‏ آهم ميزةفي مجموعة البيانات هذه لأنه يحتوي على آراء 
مستخدمي 3۷16667" حول لقاح فایزر .لکن يجب إعداد عمود النص لأنه يحتوي على العدید 
من الرموز الخاصة والأخطاء اللغوية. فیما يلى كيف یمکننا تنظيف عمود النص: 


111۵ عدن‎ E MU EE 

import re 

۲1 21۰ 001/۳۴1020 )۲ 500/0105۲ ( 

stemmer = nltk.SnowballStemmer ("english") 
۶101 كنات عدوت ج2121‎ 21083125 SEOPWOEAS 

1100011۲ 0 

stopword=set (stopwords.words ) ۲6۴013 51( ( 


def clean (text) : 
text = str (text) . lower () 
text 26 طلات‎ )' NLA, مت‎ EEz) 
EKÊ BE SUES U NEED SS ST رو‎ EER) 
EEE < iS SMO ) > 22-850 LU BEE) 


138 علم البيانات: عن طريق الامثلة 


م۲ | (ظ0 اهنا ات ظلنام ‏ 126ص زه ) 6562626 EFE‏ 5 ۲ [55] )طلاك >2 - Cex‏ 
text)‏ 

(عاعجه]ا ۲۲۸ ,۲ظ۲۱) طلتاو text — re‏ 

اس ۲۲ ۲۱۳۷۲۱۵۲ ) SUD‏ . 26 تاره 

WOES NOE EM‏ 12 (۲ ۲) ۵131و . اه EOE ۵0 IM‏ 0020م - تاره 
stopword]‏ 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

Lext=" ". join (text) 

EE EUERN 82 كك‎ 
data ["text"] = data["text"] .apply (clean) 


الان. دعنا نلقي نظرة على سحابة الكلمات (10110© ٥۲١‏ )ني عمود النص. سحابة الكلمات 
هی تقنية تصوير البیانات تعرض الکلمات الأكثر استخدامًا بخط کبیر والکلمات الأقل استخدامًا 


EE < UW ۳۰. OT 1 252ل نا 1 روط‎ E> E) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 
20160 0180 60101۲۸۳1 tell J) عدت رن‎ ale (EERE) 
1911 . ۴1 هیال‎ ) ۶1051 26-)15710(( 
plt.imshow (wordcloud, interpolation='bilinear') 
OBE عون ) ددسو‎ 

1011 . 5۳017 )( 


day‏ > هه 


3 سس‎ dose, x= 6۷0۷36 side ef 
/ ap 


VA EEN E 


dose 9 ۲12686010066 3 "ننه‎ 


۷۳۵ 


week 
tart 


Piizerbioftech Yaccine 


0۷ 1 0۷ 2661۲۲ 
grat 


e e a ES first dose 
را 4ات هه‎ 


دعنا الآن نلقي نظرة على سحابة الكلماتفي عمود الوسوم (صصتتاام» 125176285): والتي یمکن 
أن توضح نوع الوسوم التي كانت رائجة عندما كان الأشخاص یشارکون آرائهم حول لقاح فایزر: 


EEE = ۲ WOME ود كد دوگ‎ 1212 AISNE 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 

Bale KGEOUnNd 60101۲۸۵1 Eel) 6ا۵12طهو.‎ (EERE) 
1911 . ۴1 كه ۶1051 ) هیال‎ )15 ,10( ( 

BLE 1205110 ) 60 206126047 39 (001 1 حوه‎ ۲ 3 11 06811 ۲( 
ORE SS 5 ) 2522 

BLE. 5۳0 )( 
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vaccine, 
Pf ize! ۰ : 


9۲16۲101 56 vaccine 1 


PfizerBioNTech' Pfizer BiQNTECh |i 


PfizerBioNTech' CovidVaccine'" 


PfIZErBioNTeeh#-. 
: سس ها راز اب‎ 


Pfiz erBioNTech’‏ و ی 


يُظهر عمود (7611660 11561) في مجموعة البيانات ما إذاكان قد تم التحقق من المستخدمين 
الذين شاركوا آرائهم بواسطة 1571661 أم لا. المستخدم الموثق على ۲۱06867" هو شخصية عامة 
أو شخصية مشهورة. لذلك دعونا نلقي نظرة على عدد المستخدمين الذين تم التحقق منهم 
والذين شاركوا آرائهم حول لقاح فايزر: 

data["user verified"] 0وعصتامی_ م۰7۵1‎ 


False 4169 
True 5856 


Name: user_verified, 4۳۶: 4 


في الإخراج آعلاه يُظهر ۳2156 عدد المستخدمين الذين لم يتم التحقق منهم ويظهر 1206 عدد 
المستخدمين الذين تم التحقق منهم. دعنا الآن ننتقل إلى مهمة تحليل المشاعر للقاح فايزر. 
سأضيف هنا ثلاثة أعمدة آخری‌في مجموعة البيانات هذه على أنها موجبة (20516176) وسلبية 
)Negati ve)‏ ومحايدة (1:0721ع) من خلال حساب درجات المشاعرفي عمود النص: 


2111 1۰ 010181020 ) vader 1661 eon) 
sentiments = SentimentIntensityAnalyzer )( 


كك EY SESE S E) OOS EOE‏ یر مهو = EOS HEI ve‏ 9 و6 
im 01۵12 ] ۲۲۵۶۲۳۲ [‏ 

date all ۲۱۲۵9231۳76۳۲ [ << fl SERE MEME S 01211121۷7 0065و‎ )1( ] ۲۴۵9۲ Eo 1 
Tol 4۵12 ] ۲۲۵۶۲۳۲ [ 

EOE 1‏ لا هی از E)‏ وهای امروزی معا = تفع ] مداه 


in data ll text | | 
01212 < 021۳2 ] ll texe, تدع 1 ووه"‎ (| ۵0211576۲, (۲۵۱191 | | 
print (data.head() ) 


text ... Neutral 
86 folk said daikon past could treat cytokin stor... ... 0.748 
2 coronavirus sputnikv astrazeneca pfizerbiontec... ... 1.668 
6 bit sad claim fame success vaccin patriot comp... ... 0.481 
9 covidvaccin state start get monday us say pak... ... 1.068 
16 death close mark million peopl wait pfizerbio... ... 0.698 


[5 rows x 4 columns] 
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الآن دعونا نحسب شعور معظم الناس تجاه لقاح فايزر: 


sum (data ["Positive"] ) 
sum (data ["Negative"]) 
sum (data ["Neutral"] ) 


NK 
۱ | اا‎ 


def معت ع 1 سمه‎ 037 O, لت‎ 
1 ل‎ (Bb) كت‎ )220( : 
91151 ) ۲۳۵ ۵ ۳ 
6131۶ )<2( 20 )<0( : 
print ("Negative ( 
else: 
print ("Neutral © ا‎ 
56۳۲110611۲ 5606 )۶ MZ) 


Neutral © 


لذلك كانت معظم آراء المستخدمين محايدة. دعنا نلقي نظرة على إجمالي كل نتيجة عاطفية قبل 
التوصل إلى أي استنتاج: 


عد رت (LESSEE‏ ل طم 
print ("Negative: ", ۷(‏ 
رس رت EAE‏ م۳ )) 19222110 


Positive: 5 5 3 
Negative: 188.81200000000024 
Neutral: 4142.3750000000055 


مجموع الإيجابيات والسلبيات أقل بكثير من الحياديةء لذلك یمکننا القول إن مناقشة مستخدمي 
تويتر كانت حول الوعي بلقاح فايزر بدلاً من مشاركة فوائده أو عيوبه. 

الملخص 

هذه هي الطريقة التي يمكنك بها تحليل آراء مستخدمي تويتر حول لقاح فايزر.في ختام تحليل 
المشاعر هذاء يمكنني القول فقط إن مناقشة مستخدمي تويتر كانت حول الوعي بلقاح فايزر بدلاً 
من مشاركة فوائده أو عيوبه. آمل أن تكون قد أحببت هذا المقال حول تحليل المشاعر تجاه لقاح 
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2 تحليل المشاعر تجاه متحور ۵506۲08 باستخدام 


بايثون Omicron Sentiment Analysis using Python‏ 
قبل أيام قليلة صنفت منظمة الصحة العالمية نوعًا جدیدا من الفيروس التاجي 
(20101135711115): ۰3.1.1.529 کمتحور مثير للقلق أطلق عليه اسم ١٥ا1‏ 0. بعد ذلك 
مباشرة. رأينا انتشار التغريدات حول متحور :0110101 على 6۲٤٤س ٣‏ . لذاء إذاكنت تريد معرفة 
كيف يمكننا تحليل مشاعر التغريدات حول متحور ۰01016۲01 فهذه المقالة مناسبة لك.في هذه 

المقالةه سوف أطلعك على مهمة تحليل مشاعر 116700 باستخدام بايثون. 


تحليل المشاعر لمتحور 021:111:01) باستخدام بایئون 
يتم تنزيل مجموعة البيانات التى أستخدمها لمهمة تحليل مشاعر 001221015012 من ۰1622210 
والتي تم جمعهاني البداية من ۲716062 عندما كان الأشخاص يشاركون آرائهم حول متحور 
.0micron‏ فلنبدأ مهمة تحلیل المشاعر 001050 عن طریق استیراد مکتبات بایثون 

ومجموعة السانات الضروریة: 

11100۳1۲ pandas 25 0 
import seaborn as 5 
1۳001 ۳۵1۳01011110 ۰.0۷۵10 وه‎ 1 
from nltk.sentiment.vader import SentimentIntensityAnalyzer 


EF 011 ۲۵1۴001 تا ۲۲۵001 2 5 6ت‎ SCLOEWORDS 
1 119 6001 01066۳۴6101 01 


CSM)‏ تت ره ) CSU‏ ۱09 و تاد 
print )02 12 ۰.1620 )( (‏ 


id user_name ... favorites is_retweet 
@ 1465693385088321 Abaris ... e False 
1 1465693062999412746 GFTs 5 8 False 
2 1465690116442279942 Herbie Finkle (Cozy) ... 3 False 
3 1465689607165591552 Electrical Review ... 8 False 
4 ( ( 1 9 BingX Academy مک‎ 2 False 


[5 rows x 16 columns] 


مجموعة البيانات هذه كبيرة جداء دعنا نلقى نظرة على ما إذا كانت مجموعة البيانات هذه تحتوي 
على أي قيم فارغة أم لا: 


EME (OEE . 15۳1011 )( . ناو‎ )( ( 
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id 8 
user_name 86 
user_location 4438 
user_description 1278 
user_created 
user_followers 


user_friends 


8 

8 

8 
user_favourites 86 
user_verified 8 
date 8 
text 8 
hashtags 4374 
source 
retweets 8 
favorites 8 
is_retweet 8 


dtype: 64 


تحتوي مجموعة البيانات على قيم خاليةفي ثلاثة أعمدة تحتوي على بيانات نصية. وسأقوم بإزالة 
جميع الصفوف التي تحتوي على القيم الخالية : 


data = data.dropna() 


تحليل المشاعر لمتحور 60016700 

يحتوي عمود النص (01111722© 6ء])في مجموعة البيانات على التغريدات التي قام بها 
الأشخاص لمشاركة آرائهم حول متحور 0171501 .للمضي قدمّاء نحتاج إلى تنظيف هذا 
العمود وإعداده لمهمة تحليل المشاعر. إليك كيف يمكننا القيام بذلك: 


1 10۳0011 MI EK 

import re 

۲121۰ 001۳81060 )۲ 50۳00105۲ ( 

stemmer = .11م‎ 5101702 11 5 6۳۳6 ۲ ("english") 
ELON 11, قفاوم‎ EMOOE E 00۵8و‎ 

110۳8011 10 

stopword=set (stopwords.words ('english') ) 


def clean (text): 


text = str (text) .lower() 

EEE - ج26‎ SUNN LAN, ع2 ری‎ 

Ee)‏ م۲ VSI NST,‏ 1255597 ) طناد TE‏ = اعد 

e<)‏ را E‏ ارت Fe‏ < تاره 

Bext - 2> )طلاك‎ ]55[ ۲ 5 FE ٠6569626 )51110 PUNCEUAETON), م۲۲‎ 
text) 

Cex re. ,۲ظ۲۱) طلتاو‎ 1T, EexE) 

est — te SUD ١207+ Cl, EOE) 

EE — 0020م‎ EOS WOO LA زر ۴ تب بات ادها‎ 12 WOO OE با‎ 
stopword] 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

Lext=" ". join (text) 
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return text 
data ["text"] = data ["text"] .apply (clean) 


نظرًا لأننا قمنا بتنظيف عمود النصء فلنلق الآن نظرة على سحابة الكلمات (1010© لاه س )ني 
عمود النص لنلقي نظرة على أكبر عدد من الكلمات التي يستخدمها الأشخاص في تغريداتهم: 


EEE)‏ 252ل نت OLN EOE U‏ ۶ < اعد تا 

stopwords set (STOPWORDS) 

wordcloud WordCloud (stopwords=stopwords, 
20160 010_60101۲۸۵ tell 1ك لوك وار‎ ale (EERE ) 
1911 . ۴1 حم2 ۶1051 ) هیال‎ )15 ,10( ( 
plt.imshow )170 206160110, interpolation='bilinear') 
19 عانعن عا‎ LZ) 

1911 . 510170 


©1111 1ب( 0 لك‎ A Fl anita 
today 5 0۱/2۳ southı africa ۰۱06۷ Var lant 
go sguthafr.ica Case 7911161 on need 
i i 7 ۹ *omicron micron 
vaccin know O 1icron-=Ccase 
first وج‎ C case 1612 0 1۷۷-2 Case. 


ccs 


ravel ۶*2 e 001110 omıcronvar 1l 
one "01/1 اس‎ 
8 
covid variant WOr ld n omıcronvari omicron zz: 


دعنا الآن نلقي نظرة على سحابة الكلماتفي عمود الوسوم (0111212© 112511285) لإلقاء نظرة 
على أكبر عدد من علامات التصنيف التي يستخدمها الأشخاص في تغريداتهم: 


MESE eS)‏ 1212 كد L‏ وگ 12 طلهز.۲ ۲ = تاره 
stopwords = set (STOPWORDS)‏ 

wordcloud = WordCloud (stopwords=stopwords, 

Bale KG 1 0صتا0‎ 601012۲۸۵1 tell) 6ا۵12طهو.‎ (EERE) 
111 . ۴1 هیال‎ ) 22955126 )15 ,10( ( 
plt.imshow (wordcloud, interpolation='bilinear') 
OMe دع و‎ gS (HOE E A) 


plt.showO 
شهج ورن[‎ 00016۲ on ۰ COVID19' 
2 0011101 ' 001110013130+ ' : 
Omicron ' OmicronVar lent " 
۵ 5 1 uthA frica'" 


Omicron . OmiéFon. 


1ant 


a ۹ 618 ۰‏ و 


(0۷10194 01 90 


> coronavirus " 


9 ” د و aka‏ 


مم :1 BREAKING‏ ل 
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الآن سأحسب درجات المشاعر للتغریدات حول متحور 01010101 سأضيف هنا ثلاثة أعمدة 
أخرىني مجموعة البیانات هذه على آنها موجبة (20516157) وسلبية (220076ع) ومحايدة 
(1اNe)‏ من خلال حساب درجات المشاعر (500165 56161126116) في عمود النص: 


۳1 1. 0017۳81020 ) veder 1661 608۲ ( 
sentiments = SentimentIntensityAnalyzer( 


dale all موی‎ ( Sl SERE MEMES POL AEE SECOEE SE) Bos Eo اد‎ 
In 41۵12 ] ۲۲۵۶۲1 
021۲2 ] ۲۱۲۵9231576۲ [ = SECM ME O, 0127111۷7 50065 )1( ] ۲۴۵9۳۲ [ EOE 1 
iA 01۵2 ] ۲۲۵۱۲۲ [ 
02 ] ۲۵۲۵۱۲۵1۳۲ [ < ] مت 5 901171117 . 65 ۵116و‎ 225 )1( ] ۲86۵۲۲ FOS 1 


1 ظ‎ 0212 ] ۲۲۵۶۲۲ [ [ 
data < 02102 ] ] text", "2051616", ۸۲۵0211576۲, "Neutral ll | 
PE ARE (data ۰.1620 )( ( 


text Positive Negative Neutral 


@ skynew told id back omicron "odium medicum ins... 2.16 6.666 0.840 

1 someon told octob omicron 6.66 6.666 1.0 

3 autom system becom increas complex effort test... 0.00 6.066 1.000 

5 digitaldisrupt emerg technolog stay privat inv... 6.66 6.066 1.8 

7 fatigu head bodi ach occasion sore ۳۱۳۵۵۶ ۰ 0.00 9.172 0.828 

الان دعونا نرى كيف كان رد فعل معظم الناس حول متحور 01010101 : 

x = Sum )0353 ] "26051177" [( 
y = sum )032 ["Negative"] ) 
2 < SUM (daea ] ۲۱۲6۱9۲۲6۵1 ۲[( 


def SONnEIMeRNE هت‎ I O, لت‎ 
1 ۶ (a>b) and (a>c): 


911 ) !! 20 ۵ ۳ 
(ع<) 131۶ه‎ Nd (BCE): 


print ("Negative (ز زا‎ 
else: 


print ("Neutral 0 0 
sentiment_score (x, ملآ‎ Z) 


Neutral @‏ 
لذلك كانت معظم الآراء محايدة. مما يعني أن الأشخاص كانوا يشاركون معلومات حول متغير 
Omicron‏ من مشاركة أي آراء إيجابية أو سلبية. 
الملخص 
إذن هذه هي الطريقة التي يمكنك بها تحليل مشاعر متحور 20111101012 لفيروس کورونا. إنه نوع 


جديد من الفيروسات التاجية التي تم تصنيفها على أنها البديل المثير للقلق من قبل منظمة الصحة 
العالمية. آمل أن تكون قد أحببت هذا المقال حول تحليل المشاعر 012105012 باستخدام بايثون. 


تحليل جودة لمیا تخل 


Wate تحليل جودة المياه باستخدام بایئون‎ 3 
Quality Analysis using python 

يُعد الحصول على مياه الشرب المأمونة أحد الاحتياجات الأساسية لجميع البشر. من وجهة نظر 
قانونية. يعتبر الحصول على مياه الشرب أحد حقوق الإنسان الأساسية. تؤثر العديد من العوامل 
على جودة المياه (012116 77261).: كما أنها أحد مجالات البحث الرئيسيةفي التعلم الآلي. 
لذلك إذا كنت تريد معرفة كيفية إجراء تحليل جودة المياه (ئanalysi (water quality‏ 
باستخدام التعلم الآلي» فهذه المقالة مناسبة لك.في هذه المقالته سوف أطلعك على تحليل جودة 
المياه باستخدام التعلم الآلي باستخدام بايثون. 


تحليل جودة المیاه 

يعد تحليل جودة المياه أحد المجالات الرئيسية للبحثفي التعلم الالي. یعرف أيضًا باسم تحليل 
قابلية المياه للشرب (20219515 بطنلنهاهح )water‏ لأن مهمتنا هنا هي فهم جميع العوامل التي 
تؤثر على قابلية المياه للشرب وتدريب نموذج التعلم الالي الذي يمكنه تصنيف ما إذا كانت عينة 
مياه معينة آمنة أو غير صالحة للاستهلاك. 


بالنسبة لمهمة تحليل جودة المیاه. سأستخدم مجموعة بيانات ءإععهK‏ التي تحتوي على بيانات 
حول جميع العوامل الرئيسية التي تؤثر على قابلية المياه للشرب. جميع العوامل التي تؤثر على 
جودة المياه مهمة للغاية» لذلك نحتاج إلى استكشاف كل ميزة من ميزات مجموعة البيانات هذه 
بإيجاز قبل تدريب نموذج التعلم الآلي للتنبؤ بما إذا كانت عينة المياه آمنة أو غير مناسبة 
للاستهلاك. يمكنك تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل جودة المياه من هنا. 


تحليل جودة المياه باستخدام لغة بايثون 
سأبدأ مهمة تحليل جودة المياه عن طريق استيراد مكتبات بايثون ومجموعة البيانات الضرورية: 


1 وه ۰0۷۵101 1۵101011110 1۳001 
0 وه 522025 1۳0011۲ 

import seaborn as 5 

11000. وه ان‎ MP 


data > 0.168۵0 697 (walter ۳00۲01111۷ ۰. CSUN) 
0312 . ۱620 )( 


ph Hardness Solids Chloramines Sulfate Conductivity Organic_carbon Trihalomethanes Turbidity  Potability 


0 NaN 204.890455 20791.318981 7.300212 368.516441 564.308654 10.379783 86.990970 25 


2 4 3 9.275884 66.420093 3.055934 
3 16766 7441 41674 628771 
4 0 181.101509 33 6.546600 31.997993 4.075075 
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يمكنني رژية القیم الخاليةفي المعاينة الأولى لمجموعة البیانات هذه نفسها. لذلك قبل المضي 
قدمّاء دعنا نزیل جمیع الصفوف التي تحتوي على قیم فارغة: 


data = 0219 . 0100۳82 )( 
dala. 15۳1111 )( ۰ 51۳0 )( 


ph 

Hardness 
Solids 
Chloramines 
Sulfate 
Conductivity 
Organic_carbon 
Trihalomethanes 
Turbidity 
Potability 
dtype: int64 


© © © © © © © © و ه 


عمود القابلية للشرب (011111111© 1012111167) لمجموعة البيانات هذه هو العمود الذي نحتاج 

إلى توقعه لأنه يحتوي على القيمتين 0 و 1 التى تشير إلى ما إذا كانت المياه صالحة للشرب (1) 
أو غير صالحة (0) للشرب. لذلك دعونا نرى توزيع 0 و 1في عمود "67نلةط20 ": 

((10 ,15) ح<ه۶10912) 01 1011.۴1 

SMS . تاصتام‎ ۵10 (IAEA. 5012103 LEY) 


911.111 ) 1 طه دابا لاو‎ OE 1892۴60 amd Sate Wa Cer) 
1011 . 5101 )( 


لذلك هذا شيء يجب أن تلاحظه أن مجموعة البيانات هذه غير متوازنة (562122©60 (not‏ لأن 
عينات الأصفار أكثر من 1 ثانية. 
كما ذكرنا آعلاه لا توجد عوامل لا یمکننا تجاهلها والتى تؤثر على جودة المياه. لذلك دعونا 


نستكشف جميع الأعمدة واحدة تلو الأخرى. لنبدأ بإلقاء نظرة على عمود الاس الهيدروجيني 
:(ph column)‏ 
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1۳0011 0101۷ ۰. ۵201۵98 عدم و‎ 
data = data 
2100126 < 0۶:1 50012۳1 )0212, x< ۲۵۲ 
COLES = اه عازن ای‎ 11 
title= "Factors Affecting Water Quality: 
PH") 
figure. show )( 


يمثل عمود الس الهيدروجيني قيمة الأس الهيدروجيني للماء وهو عامل مهمني تقييم التوازن 
الحمضي القاعدي للماء. يجب أن تكون قيمة الرقم الهيدروجيني لمياه الشرب بين 6.5 و8.5. 
دعونا الآن نلقى نظرة على العامل الثاني الذي يؤثر على جودة المياهفي مجموعة البيانات: 


figure = px.histogram (data, x = "Hardness", 

COLSE - 566551 I EV, 

title= "Factors Affecting Water Quality: 
Hardness") 
figure. show )( 


يوضح الشكل أعلاه توزيع عسرة 3200655 الماءفي مجموعة البيانات. تعتمد عسرة الماء عادة 
على مصدره. لكن الماء الذي تصل قوته إلى 200-120 ملليغرام صالح للشرب. دعنا الآن نلقي 
نظرة على العامل التالی الذي يؤثر على جودة المياه: 


2100265 < Dx 2255606512 521002527 > < ۲9۵131057, 

واه تاه ای = و6 

title= "Factors Affecting Water Quality: 
SOLAS) 
figure. show )( 
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يمثل الشكل أعلاه توزيع إجمالي المواد الصلبة الذاثبتني الماءفي مجموعة البيانات. تسمى جميع 
المعادن العضوية وغير العضوية الموجودةفي الماء بالمواد الصلبة الذائبة. الماء الذي يحتوي على 
عدد كبير جد من المواد الصلبة الذائبة شديد التمعدن. دعنا الآن نلقي نظرة على العامل التالي 
الذي يؤثر على جودة المياه: 


figure < 0۶:1 90012۳8 (data, x — "051052510112657", 

واه 5 < نمه 

title= "Factors Affecting Water Quality: 
Chloramines"™) 
figure. show )( 


Factors Affecting Water Quality: Chloramines 


يمثل الشكل أعلاه توزيع الكلورامين (01072:016»)في الماءفي مجموعة البيانات. الكلورامين 
والكلور من المطهرات المستخدمةفي أنظمة المياه العامة. دعنا الآن نلقى نظرة على العامل التالى 
الذي يؤثر على جودة المياه: 


figure = px.histogram (data, x = "Sulfate", 

0۵1 که‎ EOC EY, 

title= "Factors Affecting Water Quality: 
Sulfate") 
figure. show )( 


تحليل جود المي باستخدا و 


يوضح الشكل أعلاه توزيع الكبريتات (sulfate)‏ الماءفي مجموعة البيانات. إنها مواد موجودة 
بشكل طبيعي ني المعادن والتربة والصخور. الماء الذي يحتوي على أقل من 500 ملليغرام من 
الكبريتات آمن للشرب. الآن دعونا نرى العامل التالى: 


21600126 < 2۶:1 50012۳0 )0212, 2د‎ < 206260-51 VIE, 
09 ات اه اه ی 5 ن‎ 


title= "Factors Affecting Water Quality: 
(COREE A E A) 


figure. show )( 


يمثل الشكل أعلاه توزيع موصلية المياه (رزلناءuلدهء‏ )في مجموعة البيانات. الماء 
موصل جيد للکهرباء» لكن أنقى أشكال الماء ليس موصلا جیذا للكهرباء. المياه ذات التوصيل 
الكهربائي أقل من 500 صالحة للشرب. الآن دعونا نرى العامل التالي: 


۶ ه 0۲201 < x‏ ,021]6) 191092۳ كعم > نان ۴1 
EV‏ ساره ای ح COLO‏ 


title= "Factors Affecting Water Quality: 
26220212 2 


figure. show )( 


150 علم البيانات: عن طريق الامثلة 


يمثل الشكل أعلاه توزيع الكربون العضوي (2101© 0722116 )ني الماءفي مجموعة البيانات. 
يأتي الكربون العضوي من انهيار المواد العضوية الطبيعية والمصادر الاصطناعية. تعتبر المياه التي 
تحتوي على أقل من 25 ملليجرام من الكربون العضوي آمنة للشرب. دعنا الآن نلقي نظرة على 
العامل التالي الذي يؤثر على جودة مياه الشرب: 


figure = px.histogram (data, x = "Trihalomethanes", 

EY,‏ 1 < نع 

title= "Factors Affecting Water Quality: 
Trihalomethanes") 
figure. show () 


Factors Affecting Water Quality: Trihalomethanes 


يمثل الشكل أعلاه توزيع ثلاثي الميثان (6002065<هطنت) أو (1111/1)في الماءفي مجموعة 
البيانات. 1111۷15" هي مواد كيميائية موجودةفي المياه المعالجة بالكلور. تعتبر المياه التي تحتوي 
على أقل من 80 مللیجرام من 1۳10۷5 آمنة للشرب. دعنا الآن نلقي نظرة على العامل التالي‌ني 
مجموعة البيانات الذي يؤثر على جودة مياه الشرب: 


21600126 < 0۶:1 50012۳1 (IAEA, <>. 5 

ال تساه اه = ن 09 

title= "Factors Affecting Water Quality: 
TUE Dal SIE) 
figure. show )( 


نم 
1 


تحلیل جودة المیاه باستخدام بایئون 1 


یمثل الشکل آعلاه توزیع العكارة (0101017::)في الماء. تعتمد عكارة الماء على عدد المواد 
الصلبة الموجودةني المعلق. تعتبر المیاه ذات العكارة آقل من 5 مللیغرام صالحة للشرب. 


نموذج التنبق بجودة المیاه باستخدام لغة بایئون 
في القسم آعلاه. استکشفنا جمیع المیزات التي توثر على جودة المیاه. الان. الخطوة التالية هي 
تدریب نموذج التعلم الالي لمهمة تحلیل جودة المیاه باستخدام بايثون. لهذه المهمةء سأستخدم 
مکتبة 2770276 في بایشون. إذا لم تكن قد استخدمت هذه المکتبة من قبل. فيمكنك تثبيتها 
بسهولة على نظامك باستخدام الأمر مذم: 

pip install pycaret 1‏ 
قبل تدريب نموذج التعلم الالي دعنا نلقي نظرة على الارتباط (01612102©) بين جميع 
الميزات فيما يتعلق بعمود القابلية للشرب (ححصدامی 206311167)في مجموعة البيانات: 


COE )(‏ 02۳3 = 08 ۵116111 
(6و 002۳1 01 29660) ۷۵11۵9 01۲و . | ۲۵۲ ] جوم 61 601161 


1.68 طم 
Hardness 0.108948‏ 
Organic_carbon 0.028375‏ 
Trihalomethanes 0.018278‏ 
Potability 6.0‏ 
Conductivity 0.014128‏ 
Sulfate 90.010524‏ 
Chloramines - 8‏ 
Turbidity -6.9‏ 
Solids -, 5‏ 


Name: ph, 48۵: 4 


الآن فیما يلي كيف يمكنك معرفة أي خوارزمية تعلم الآلة هي الأفضل لمجموعة البیانات هذه 
باستخدام مكتبة 0216۲ ,ني بايثون: 

۶101 ۵۷0۵161 . 128 91 ۶1 62۵1 ON AMOS E 

clf = setup (data, target = ۲5۵۲۵۳01111۷7۲, silent = True, 


(786 < 10 91 وهو 
compare models )(‏ 


2۳ علم البيانات: عن طريقالمثلة 


Model Accuracy AUC Recall Prec. F1 Kappa MCC TT (Sec)‏ ما 
rf Random Forest Classifier 0.6830 0.7005 0.4197 0.6744 0.5133 0.2976 2 0.724‏ 

qda Quadratic Discriminant Analysis 0.6823 0.7192 0.3985 0.6883 0.5013 0.2917 4 0.022 

et Extra Trees Classifier 0.6816 0.6941 0.3861 0.6858 0.4916 0.2863 3 0.557 


lightgbm Light Gradient Boosting Machine 0.6652 0.6916 0.4762 0.6078 0.5324 0.2781 0.2840 0.172 


Gradient Boosting Classifier 0.6602 0.6738 0.3718 0.6306 0.4667 0.2419 3 0.339‏ »و 
nb Naive Bayes 0.6184 0.6078 0.2478 0.5545 0.3412 0.1261 0.1462 0.019‏ 
dt Decision Tree Classifier 0.6034 0.5895 0.5186 0.5049 0.5097 0.1775 4 0.027‏ 
ır Logistic Regression 0.5984 0.5199 0.0071 0.1900 0.0134 0.0028 7 0.355‏ 

ridge Ridge Classifier 0.5984 0.0000 0.0089 0.1583 0.0168 0.0035 6 0.021 

Ida Linear Discriminant Analysis 0.5977 0.4903 0.0089 0.1500 0.0167 0.0021 0.024 0.022 

ada Ada Boost Classifier 0.5956 0.5671 0.2919 0.4896 0.3644 0.0972 4 0.173 

knn K Neighbors Classifier 0.5743 0.5423 0.3644 0.4642 0.4070 0.0826 0.0846 0.121 

svm SVM - Linear Kernel 0.5194 0.0000 0.3982 0.1604 0.2287 -0.0014 -4 0.027 


وفقا للنتيجة أعلاه. فإن خوارزمية الغابة العشوائية (1011656)14 1211010111هى الأفضل لتدريب 
نموذج التعلم الالي لمهمة تحلیل جودة المیاه. لذلك دعونا ندرب النموذج ونفحص تنبواته: 


model < create MOE LEE) 
۳16031 ]اه‎ < 0601 56 model (model, data daea) 
predict.head() 


ph Hardness solids Chloramines Sulfate Conductivity Organic_carbon Trihalomethanes Turbidity Potability Label Score 
3 8.316766 214.373394 1 8.059332 356.886136 ۰ 6 18.436524 100.341674 4.628771 0 0 087 
4 9.092223 181101509 39 6.546600 310.135736 ۰ ۰ ۰ ۰3 11.558279 31.997993 4.075075 0 0 o91 
5 5.584087 188.313324 9 7.544869 326.678363 ۰ 6 8.399735 54.917862 2.559708 0 0 083 
6 10.223862 248.071735 28749716544 7.513408 393.663396 4 13.789695 84.603556 2.672989 0 0 9 
7 8635849 203.361523 13672.091764 4563009 303.309771 ۰ 45 12.363817 62.798309 4401425 0 0 موه‎ 


النتائج المذكورة أعلاه تبدو مرضية. آمل أن تكون قد أحببت مشروع التعلم الآلي هذا حول تحليل 
جودة المياه باستخدام بايثون. 


الملخص 

هذه هي الطريقة التي يمكنك بها تحليل جودة المياه وتدريب نموذج التعلم الآلي لتصنيف المياه 
الآمنة وغير الآمنة للشرب. يُعد الحصول على مياه الشرب المأمونة أحد الاحتياجات الأساسية 
لجميع البشر. من وجهة نظر قانونية» يعتبر الحصول على مياه الشرب أحد حقوق الانسان 
الأساسية. تؤثر العديد من العوامل على جودة المياهء كما أنها أحد مجالات البحث الرئيسيةفي 


التعلم الال 
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4 تحليل المشاعر على ۲77166۲ باستخدام بايثون 


Twitter Sentiment Analysis using Python 
هو أحد منصات التواصل الاجتماعي حيث يتمتع الأشخاص بحرية مشاركة آرائهم‎ 11 


حول أي موضوع. نرى أحيانًا مناقشة قوية على 1710062 حول رأي شخص ما تؤدي أحياتًا إلى 
المشاعر (212177515 561161126116) على ۰۲۳/16۲6۲ فهذه المقالة مناسبة لك.في هذه المقالة 


سوف أطلعك على مهمة تحليل المشاعر على 1716607 باستخدام بايثون. 


تحليل المشاعر على Twitter‏ 

تحلیل المشاعر مهمة معالجة اللغة الطبيعية (عصلووی0۲0 1311511256 11311131). يجب على 
جمیع منصات وسائل التواصل الاجتماعي مراقبة مشاعر المشاركينفي المناقشة. نرىفي الغالب 
آراء سلبية على تویتر عندما تکون المناقشة سياسية. لذلك. يجب أن تستمر كل منصةفي تحلیل 
المشاعر للعثور على نوع الأشخاص الذین ینشرون الكراهية والسلبية على نظامهم الأساسي. 


بالنسبة لمهمة تحلیل المشاعر على 1۷1067" قمت بجمع مجموعة بیانات من 122816 تحتوي 
على تخریدات حول مناقشة طويلة داخل مجموعة من المستخدمین. مهمتنا هنا هى تحدید عدد 
التغريدات السلبية والإيجابية حتى نتمكن من إعطاء نتيجة. لذلك.في القسم أدناه سأقدم لك 
مهمة تحليل المشاعر على ۷10067[ باستخدام بايثون. 


تحليل المشاعر على 175716661 ' باستخدام بايثون 
لنبدأ مهمة تحليل المشاعر على ۲716067 من خلال استيراد مکتبات بايثون ومجموعة البيانات 
اللازمة: 


1۳001۲ pandas وه‎ 0 

311۳0۵0 6 MUMOY وه‎ AP 

۴1۲010 51616810. Fed ل .ادها , ط0 مارم با‎ COUREVEGIE OE ZOE 
دط‎ 0۱۲ ۵۳۴69۳1 model Selection اه بر‎ 9۳ ESE داد‎ E 

from sklearn.tree import 161 91 00126601 ده ۶1 3 و‎ 

import re 

110001 REK 

1 10۳8011 1 


data = 

0۰7620 csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/twitter.csv") 

print (data.head() ( 
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Unnamed: 6 count hate_speech offensive_language neither class ١ 


8 8 3 8 8 3 2 

1 1 3 8 3 8 1 

2 2 3 8 3 8 3 

3 3 3 8 2 3 1 

03 4 6 8 6 8 1 
tweet 

6© !!! RT @mayasolovely: As a woman you shouldn't... 

1 !!!!! RT @mleew17: boy dats cold...tyga dun ba... 

2 !!!!!!! RT @UrKindOfBrand Dawg!!!! RT 0862902 

3 !!!!!!!!! RT @C_G_Anderson: @viva_based she lo 

4 !!!!!!!!!!!!! RT @ShenikaRoberts: The shit you... 


يحتوي عمود التغريدة(011111111© )0766) ی مجموعة البيانات أعلاه على التغريدات التي نحتاج 

إلى استخدامها لتحليل مشاعر المشاركينفي المناقشة. ولكن للمضی قدمّاء يتعين علينا تنظيف 

الكثير من الأخطاء والرموز الخاصة الأخرى لأن هذه التغريدات تحتوي على الكثير من الأخطاء 
اللغوية. إذن إليك كيف يمكننا تنظيف عمود التغريدة: 

۲121۰ 001۳81060 )۲ 50۳00۵105۲ ( 

stemmer = nltk.SnowballStemmer ("english") 

۶101 11, قفاوم‎ EMOOEE SEODWOEAS 


1100011۲ 10 
stopword=set (stopwords.words ) ۲68013 51(( 


def EES 


text = str (text) .lower () 

Ex E < EFE SUD DOI GG SEER 

BEE >. FE )ملسن‎ MESES ارم‎ SV ES م۲۲‎ Ce) 

E = 25 SUIS PIE, م۲۲‎ E) 

text = re.sub(' ]55[ ۲ 5 re.escape(string.punctuation), '', 
text) 

bext - 22 SUB ١2! TS Ee 

EOE — 25 SUMO CONE NON مر‎ IF, EEE) 

El = OE ۶۵ ۵0 AA ۵13و . اه‎ )۲ ۲( BE MOE Mol, LO 
stopword] 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

"١ [0111 (ECXE)‏ ال تاكرح 


۳ ۱1 كك ك8‎ 
data ["tweet"] = 0212 ] ۲۲۷/۵۵۲۲ [ ۰20017 (clean) 


الآنء الخطوة التالية هی حساب درجات المشاعر (60۲65: ۲حعحصتاصته) لهذه التغریدات 
وتعيين تسمية للتغريدات على أنها إيجابية (©205665) أو سلبية (Negative)‏ أو محايدة 
(116521ا81). إليك كيفية حساب درجات المشاعرفي التغريدات: 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 

51 1 ۰ 01017۳81020 ) vader 1661 مك‎ 

sentiments = SentimentIntensityAnalyzer )( 

dale al LEO SH E ve Sl SERE MEME 8 + مهد مانت م‎ ۳ Bos EOE كك‎ 
in data ] "tweet" [ [ 
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02۲2 ] ۲۱۲۵9231576۳۲ [ > ]] SERE MEME S 0069و 57 هلمم‎ )1( ] ۲۴۵9۲ Eo 1 
in data ["tweet"] [ 
data ["Neutral"] = 
in data ["tweet"] ] 


الآن سأختار فقط الأعمدة من هذه البيانات التي نحتاجها لبقية مهمة تحليل المشاعر على 


: Twitter 


|] سعد‎ TREES ونر‎ LEY SCEOLES RE) [UREN EOE 1 


data = data ] ["tweet", "Positive", 
"Negative", "Neutral"] ] 
print (data.head() ) 


tweet Positive Negative \ 


86 rt mayasolov woman shouldnt complain clean ho... 0.147 2.7 

1 rt boy dat coldtyga dwn bad cuffin dat hoe ۰ 6.666 0.280 

2 rt urkindofbrand dawg rt ever fuck bitch sta... 6.066 0.577 

3 rt cganderson vivabas look like tranni 0.333 6.666 

4 rt shenikarobert shit hear might true might f... 0.154 0.407 
Neutral 

8 0.696 

1 0.720 

2 23 

3 67 

4 6.448 


دعنا الآن نلقى نظرة على التصنيف الأكثر شيوعًا المخصص للتغريدات وفقًا لدرجات المشاعر: 


x — Sum 09531 205512531721 
= sum (data ["Negative"]) 
2 = sum (data ["Neutral"] ) 


> 


deE SOMEIMeNE SEE, O, د ری‎ 
E (O) AON (AZC) : 
print ("Positive @ ") 
6131۶ )<2( 23:14 (GC: 
print ("Negative 5 
else: 
print ("Neutral 5 "0 
56۳۲110611 SESE, ۷ 2( 


Neutral © 


لذا فإن معظم التغریدات محايدة ([2611652): ما يعني آنها ليست إيجابية ولا سلبية. الآن دعنا 
نلقی نظرة على إجمالى درجات المشاعر: 


182211016 1) 12/۵ EEE 7 راد‎ 
print ("Negative: ", ۷( 
OE ie رت ایا‎ = 


Positive: 89 
Negative: 7201.020999999922 
Neutral: 14696.887999999733 
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مجموع التغريدات المحايدة أعلى بكثير من السلبية والایجابية. لكن من بين جميع التغريدات 
السلبية أكبر من التغريدات الإيجابيةء لذلك یمکننا القول إن معظم الآراء سلبية. 


الملخص 

هذه هي الطريقة التي يمكنك بها أداء مهمة تحليل المشاعر على 11076667" باستخدام لغة برمجة 
بايثون. تحليل المشاعر مهمة معالجة اللغة الطبيعية. تحتاج جميع منصات وسائل التواصل 
الاجتماعي إلى التحقق من مشاعر الأشخاص المشارکين‌في المناقشة. آمل أن تكون قد أحبيت 
هذا المقال على تحليل المشاعر على 1۱10067" باستخدام بايثون. 


تحليل مشاعر لعبة الحبار باستخدام بايثون 157 


5 تحليل مشاعر لعبة الحبار باستخدام بايثون 4نتاو5 
Game Sentiment Analysis using Python‏ 


تعد لعبة الحبار (6مع 501110) حاليًا واحدة من أكثر العروض شیوعا على ناه آ. من 
الشائع جدا أن الأشخاص الذين لم يشاهدوا أي سلسلة ويب من قبل يشاهدونها أيضًا. أحد 
أسباب ذلك هو آراء وآراء المشاهدين على وسائل التواصل الاجتماعى. لذلك إذاكنت تريد معرفة 
كيفية تحليل مشاعر الناس حول لعبة الحبارء فهذه المقالة مناسبة كدق هذه المقالة سوف 
آخذك خلال مهمة تحليل مشاعر لعبة الحبار باستخدام بايثون. 


تحليل المشاعر لعبة الحبار باستخدام بایئون 
يتم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل مشاعر لعبة الحبار من »1681 والتي 
تم جمعهاني البداية من 1710062 بينما كان الأشخاص يشاركون بنشاط آراتهم حول لعبة الحبار. 
لنبدأ مهمة تحليل مشاعر لعبة الحبار عن طريق استيراد مكتبات بايثون ومجموعة البيانات 

الضرورية: 

import pandas as pd 
import seaborn as sns 
1۳001 1۵101011110 ۰0۷۵101 وه‎ 1 
from nltk.sentiment.vader import SentimentIntensityAnalyzer 


۶1018 ۵1۴001 8اه‎ MOOSE ات ل ل‎ SIOEVWORDS, 
111266001052221 


data > 0.1680 697 )۲5 10 Game دعت‎ 
print (data.head() ) 


user_name user_location ... source is_retweet 
6© the _ûndër-ratèd niggéh © NaN ... Twitter for Android False 
1 Best uncle on planet earth NaN ... Twitter for Android False 
2 marcie NaN ... Twitter Web App False 
3 YoMo.Mdp Any pronouns 355 Twitter leb App False 
4 Laura Reactions France ... Twitter Web App False 


[5 rows x 12 columns] 
(user location) فی الانطباعات الأولى لمجموعة البيانات هذه لاحظت قيمًا خاليةفي عمود‎ 
يبدو أنها لا تؤثر على مهمة تحليل المشاعر. لذلك سوف أسقط هذا العمود:‎ 
615:55 < درة 1۳ . واه‎ (COLUMN SUSE ۵0۵10۳, 1S) 


دعنا الآن نلقي نظرة على ما إذا كانت الاعمدة الأخرى تحتوي على أي قیم فارغة أم لا: 


( () ناو . () 15۳1011 . 12 02) 911 
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user_name 4 
user_description 5211 
user_created 
user_followers 
user_friends 
user_favourites 
user_verified 
date 

text 


source 
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is_retweet 


dtype: int64 


يحتوي عمود (user descripti01)‏ أيضًا على قيم خالية. والتي لن تؤثر أيضًا على مهمة تحليل 
المشاعر. لذلك سأحذف هذا العمود أيضا: 


82162 > 0218 . 0100 حوص601)‎ USER 0690۲1 0101", (1حولیه‎ 
data = data.dropna) 


يحتوي عمود النص (100)في مجموعة البيانات على آراء مستخدمي تويتر حول لعبة الحبا 
فهذه آراء لوسائل التواصل الاجتماعى» لذا يجب تحضير هذا العمود قبل أي تحليل. لذلك دعونا 
نجهز هذا العمود لمهمة تحليل المشاعر: 


110001 REKE 

import re 

۲121۰ 001/۳۴1080 )۲ 2502-5 1) 

stemmer = .11م‎ 510170211 5 6۳۳6 ۲ ("english") 
۶101 MEEK اطه م1 كنات عدوت‎ 26 

110۳8011 10 

stopword=set (stopwords.words ('english') ) 


def clean (text) : 


text = str (text) .lower () 

EEX - FE. SUD CNL, 17 CE 

Cex)‏ م۲۲ ۱۷۲۱۰۱۵ MEEPS INS‏ ) طناو EE‏ - ادها 

6ت و SUL CRT‏ 25 - ازع ع 

Lext = 2 . ع2 5 ۲ [55] ۲) طلناو‎ . 90۳06 (string.punctuation), '', 
1 6261 ( 

NM, CC. EEE)‏ )ا ات 36 = دهع 

26 م۲۲ ۲۱۳*۱۵۱۷ ) طناو . ۲۵ - text‏ 

صل ام WOO‏ 12 (۲ ۲) ۵13و . اه سد EOS WOM‏ 0020م = تاره 
stopword]‏ 

text=" ". join (text) 

text = [stemmer.stem (word) for word in text.split(' '([ 

Lext=" ". join (text) 

return text 
data ["text"] = data ] ۲۲۵۶۲۳۲ [ .apply (clean) 


دعنا الآن نلقي نظرة على الكلمات الأكثر استخدامًاني آراء لعبة الحبار باستخدام سحابة الكلمات 
(0تامل 4ه7). سحابة الكلمات هی أداة تصوير البيانات تعرض الكلمات الأكثر استخدامًا 
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textê < ۳ ONL EOE 1 واه نت‎ EOE) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud (stopwords=stopwords, 
20160 0180 601012۳۸۳۸1 Eel) عدت ع ان‎ ale (EEE) 
1911 . ۴1 <م2 ۶1051 ) هیال‎ )15 200 
plt.imshow (wordcloud, interpolation='bilinear') 
19 وا‎ SSE SI OEE E) 

1011 . 5۳017 )( 


finish >) 1 squidgam netflix? fus 
لا د‎ 1d 7: 
: ۳0۸0 


qi د 1 عدون‎ light red light 
ma Kk 


ی 10 1 
5011108 


think د‎ ۱ episod squidgam 


watch 50۱ 1 0 2*7 


quıdg 3 رu1dgamer‎ 5 1 8 peopl netflix 


الآن دعنا ننتقل إلى مهمة تحليل المشاعرفي لعبة الحبار. سأضيف هنا ثلاثة أعمدة آخری‌ني 
مجموعة البيانات هذه على أنها موجبة (Positive)‏ وسلبية (Negative)‏ ومحايدة (Neutral)‏ 


من خلال حساب درجات المشاعر (5001©5 5©1261116126)في عمود النص: 


211 1۰ 010181020 ) vader lexicon) 
sentiments = SentimentIntensityAnalyzer )( 


dae al EOS EI vel = SCREIMEMES PO LAE EY SESS O) OOS EOE 
o CENE EOE 1 

02۲6 ] Meqale welll SS SENE MEMES 012۳1111۷7 50069 )1( ] ۲۴۵9۲ [ Eo 1 
in 0213 ] ۲۲۵۸۱۲۲ [ 

SEOLES E) NEU EOE 1‏ اه اه [SENE MODES‏ = وتات ۱۱6 9 تا وه 


از | ENE I EEE‏ لكل 
data < datal| text, "260516176, "11203812 Neutral "[ [‏ 
print (data.head() )‏ 


text Positive Negative Neutral 


9 life hit time poverti strike yougong yoo let ... 0.173 0.108 0.719 
1 marbl episod squidgam ruin © © © 6,8 0.487 0.513 
2 squidgam time 9.000 6.666 1.66 
3 blood 5110615 join squidgam thing im 316301 ... 90.142 0.277 2.1 
4 two first game player kill mask guy bloodi ni... 6.068 21 0.539 


دعنا الآن نحسب كيف يفكر معظم الناسفي لعبة الحبار: 


x = sum (data["Positive"]) 
y = sum (data ["Negative"] ) 
z = sum (data ["Neutral"] ) 


def وهای‎ Seome la, O, O: 
212 (طحة)‎ and (a ©): 


print ("Positive @ 
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6131۴ )<2( 2۳0 )<0( : 


print ("Negative 5 
else: 


print ("Neutral © 5 
sentiment_score (x, ,لآ‎ 2( 


Neutral © 


لذا فإن معظم آراء المستخدمين حيادية. فلنلق الآن نظرة على إجمالي كل درجة المشاعر قبل 
التوصل إلى آي استنتاج: 
د رت DERE ۳۱2/۵۵ VE‏ 
Vv)‏ ,۳۲ :2۵۲17۲76 ۲(۲۵) 1911 
)= رت انیا باصم 
Positive: 10604 9976‏ 


Negative: 1 
Neutral: 32 


إجمالي السلبیات أقل بکثیر من الإيجابيةء لذلك یمکننا القول إن معظم الاراء حول لعبة الحبار 
إنجابية. 


الملخص 

تعد لعبة الحبار حاليًا واحدة من أكثر العروض شیوعا على 71664[1. أحد أسباب ذلك هو آراء 
وآراء المشاهدين على وسائل التواصل الاجتماعي. آمل أن تكون قد أحببت هذا المقال حول 
تحليل المشاعرفي لعبة الحبار باستخدام بايثون. 
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Movie تحليل تصنيف الفيلم باستخدام بايثون‎ )6 
Rating Analysis using Python 

نشاهد جميعًا الأفلام للترفیه» والبعض منا لا يقيمها أبدَاء بينما يقوم بعض المشاهدين دائمًا 
بتقييم كل فيلم يشاهدونه. يساعد هذا النوع من المشاهدينفي تصنيف الأفلام للأشخاص الذين 
يراجعون مراجعات الفيلم قبل مشاهدة أي فيلم للتأكد من أنهم على وشك مشاهدة فيلم جيد. 
لذلك. إذا كنت جديدَاني علم البيانات وترغبفي معرفة كيفية تحليل تقييمات الأفلام باستخدام 
لغة برمجة بایثون. فهذه المقالة مناسبة لك.في هذه المقالة سوف أطلعك على مهمة تحليل 
تصنيف الأفلام )Movie Rating Analysis)‏ باستخدام بايثون. 


تحليل تصنيف الفيلم باستخدام بايثون 
يساعد تحليل التصنيف الذي قدمه مشاهدو الفيلم العديد من الأشخاص في تحديد ما إذا كانوا 
سيشاهدون هذا الفيلم أم لا. لذلك. بالنسبة لمهمة تحليل تصنيف الفيلم» تحتاج أولاً إلى 
مجموعة بيانات تحتوي على بيانات حول التصنیفات التي قدمهاكل عارض. لهذه المهمة. قمت 
بجمع مجموعة بيانات من 1528816 تحتوي على ملفين: 
1. يحتوي ملف واحد على بيانات حول معرف الفيلم (movie Id)‏ وعنوانه (title)‏ 
ونوعه (ع:1ع9). 


2. ويحتوي الملف الآخر على معرف المستخدم (10 11561) ومعرف الفيلم ( 1101716 
0) والتقييمات (7201285) التي قدمها المستخدم والطابع الزمني للتصنيفات. 
يمكنك تنزيل مجموعتي البيانات هاتين من هنا. 
لنبدأ الآن بمهمة تحليل تصنيف الأفلام عن طريق استيراد مكتبات بايثون ومجموعات البيانات 
الضرورية: 
6 قح للك بلصت هك 
0 وه Bandas‏ 1۳0011۲ 


11017165 > 00۰۲62۵0 CSU )۲۲۵۵۲ 165 dally, 06131101 اه‎ ۲ ::۲( 
print (movies.head )( ( 


8 18 La sortie des usines Lumière (1895) Documentary | Short 
1 12 The Arrival of a Train (1896) Documentary | Short 
2 25 The Oxford and Cambridge University Boat Race ۰ NaN 
3 91 Le manoir du diable (1896) Short | Horror 
4 131 Une nuit terrible (1896) Short [Comedy | 


في الكود آعلاه. قمت فقط باستيراد مجموعة بيانات الأفلام التي لا تحتوي على أي أسماء أعمدة 
لذلك دعونا نحدد أسماء الأعمدة: 
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۲۱۵۲71695 ESLUNAS < TDL, ۲116۷۲, 6222 [ 
print (movies.head )( ( 


10 Title Genre 
86 186 La sortie des usines Lumière (1895) Documentary | Short 
ل + لا‎ The Arrival of a Train (1896) Documentary | Short 
2 25 The Oxford and Cambridge University Boat Race ... NaN 
3 94 Le manoir du diable (1896) Short | Horror 
4 131 Une nuit terrible (1896) Short [Comedy [Horror 


الآن دعنا نستورد مجموعة بيانات التصنيفات (0262566 72361255): 


EATS > PA 2 بردة 24ت‎ )١ تدك رت‎ | elimi EEF 2) 
911 ) 2 عاك‎ AROS head (J) 


060 8 0114508 1 
8 9 499549 2 ©6 
7 58 1 2 1 
9 1 1428538 2 2 
4 753141 لاوا 
۰6 162926 3 4 


لا تحتوي مجموعة بيانات التصنيف أيضًا على أي أسماء آعمدق لذلك دعونا نحدد أسماء 
الأعمدة لهذه البيانات أيضًا: 


| 0ت عت ا روما مدای وا USE, ID,‏ اج 2202-5 ونم و تدس EA‏ 
head )( (‏ 22162955 ) 1 11 


User ID Ratings Timestamp 
8 2 9 9 8 
1 2 1 5 7 
2 2 8 1 1371307089 
3 3 75314 1 1595468524 
3 126 5 6 


سأقوم الآن بدمج مجموعتي البيانات هاتينفي واحدة. تحتوي مجموعتي البيانات هاتين على 
هذا العمود کعمود مشترك لدمج مجموعتي البيانات: 


data = pd.merge (movies, ratings, on=["ID", "ID"]) 
print (data.head () ) 


ID Title ... Ratings Timestamp 
6 16 La sortie des usines Lumière (1895) ۰ 16 3 
1 3 The Arrival of a Train (1896) ... 16 9 
2 25 The Oxford and Cambridge University Boat Race ... ... 8 1488199 
3 91 Le manoir du diable (1896) ... 6 5 
4 91 Le manoir du diable (1896) ... 5 49 


[5 rows x 6 columns] 
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نظرًا لأنها مهمة علی مستوی المبتدئین» سأقوم أولاً بالقاء نظرة علی توزیع تصنیفات جمیع 
الأفلام التي قدمها المشاهدون: 


25831265 > dalal 25822605 | ۰۷72116 60۱7065 )( 

numbers = ratings.index 

quantity = ratings.values 

import plotly.express as 2 

fig = px.pie (data, values=quantity, names=numbers) 
۶1 0 . 5107 )( 


© ب 
o‏ 


١! 1 1 ۷ 1! 18! 6 8‏ ۲ 
هه 0 غم چیه ذه نبا هم زيم تت 


لذلك. وفقا لمخطط الدائرة المجزأة (141۲ء 16م) آعلاه تم تصنيف معظم الأفلام 8 من قبل 
المستخدمين. من الشكل أعلاهء يمكن القول إن معظم الأفلام تم تصنيفها بشكل إيجابي 

نظرًا لآن الرقم 10 هو أعلى تصنيف يمكن للمشاهد تقدیمه. فلئلق نظرة على أفضل 10 آفلام 
حصلت على 10 تقييمات من قبل المشاهدين: 


03632 = data.query ("Ratings == 10") 
11 )042622 ELEN ۰72116 COUR ES) head )10(( 


Joker (2019) 1479 
Interstellar (2014) 1382 
1917 )2619( 819 
Avengers: Endgame (2019) 868 
The Shawshank Redemption (1994) 699 
Gravity (2013) 653 
The Wolf of Wall Street (2013) 581 
Hacksaw Ridge (2016) 578 
Avengers: Infinity War (2018) 534 
La La Land (2016) 510 


Name: Title, dtype: 4 
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لذلك. وفقًا لمجموعة البيانات هذه. حصل (01672019) على أعلى عدد 10 تقييمات من 
المشاهدين. هذه هي الطريقة التي يمكنك بها تحليل تقييمات الأفلام باستخدام بايثون كمبتدئ 
في علم البيانات. 

الملخص 

هذه هي الطريقة التي يمكنك بها إجراء تحليل تصنيف الفيلم باستخدام لغة برمجة بایثون كمبتدئ 
في علوم البيانات. يساعد تحليل التصنيفات التي قدمها مشاهدو الفيلم العديد من الأشخاص في 
تحديد ما إذا کانوا سيشاهدون هذا الفيلم أم لا. آمل أن تكون قد أحببت هذه المقالة حول تحليل 
تصنيف الافلام باستخدام بايثون. 


7 تحليل المليارديرات مع بايثون Billionaires‏ 
Analysis with Python‏ 
يقول عدد المليارديرات (131111022165)في بلد ما الكثير عن بيثة الأعمال ومعدل نجاح بدء 
التشغيل والعديد من الميزات الاقتصادية الأخرى للبلد. لذلك إذا كنت تريد معرفة المزيد حول 
كيفية إيجاد علاقات بين المليارديرات حول العالم. فهذه المقالة مناسبة لك.في هذه المقالة 
سوف أطلعك على مهمة تحليل المليارديرات باستخدام بايثون. 
تحليل المليارديرات مع بايثون 
مجموعة البيانات التي أستخدمها لتحليل البيانات حول المليارديرات حول العالم برعاية مجلة 
5 ويتم تنزيلها من 16عع1628. تحتوي مجموعة البيانات على معلومات حول المليارديرات 
العالميينفي عام 2021 بمافي ذلك: 

1 الا تام .(Names)‏ 

.(Net Worth) صافي القيمة‎ .2 

.(Country) الدولة‎ .3 

.)Source) المصدر‎ .4 

5. المرتبة (علصحمل). 


6. العمر (ءعع2). 


.(Industry) الصناعة‎ .7 


فلنبدأ بمهمة تحليل المليارديرات عن طريق استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


1۳001۲ Candas وه‎ 0 

11000. وه ان‎ MP 

import seaborn as 585 

1 وه ۰0۷۵101 1۵101011110 1۳001 


data = 

pd.read csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/Billionaire.csv") 

11۱6 )04212 CSE )(( 
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Name NetWorth Country Source Rank Age Industry 
6 Jeff 86205 $177 8 United States Amazon 1 0.8 Technology 
1 Elon Musk 5151 8 United States Tesla, SpaceX 2 49.0 Automotive 
2 Bernard Arnault 8 family 5156 8 France LUMH 3 72.0 Fashion & Retail 
3 Bill Gates $124 8 United States Microsoft 4 65.0 Technology 
4 Mark Zuckerberg $97 8 United States Facebook 5 36.0 Technology 


قبل المضي قدمًاء دعنا نرى ما إذا كانت مجموعة البيانات هذه تحتوي على قيم مفقودة أم لا: 
sS SU‏ () نورد (OA EE‏ جك 1E‏ 


Name 
NetWorth 
Country 
Source 
Rank 

Age 79 
Industry 0 
dtype: 4 
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إذن» تحتوي مجموعة البيانات هذه على 79 قيمة مفقودةفي عمود العمر (صحصتام ع۸۵). 
فلنزيل هذه الصفوف: 

data > dala 04256 2:12)‏ 
يحتوي عمود صافي الثروة (0۲۲1 ۲۷ء )في مجموعة البيانات هذه على علامة في بداية صافي 
ثروة المليارديرات و8في النهاية. لذلك نحتاج إلى إزالة هذه العلامات وتحويل عمود صافي الثروة 
إلى قيمة عائمة (0020): 


022 ] ۲۵۲۵۲۲۵۷ [ < 0212 ] 215 | SEE SEES) 
0212 ] ۲۲۲۵۱۲۲۵۳۳۲ [ < 4212 ] ۲۲۲۵۲۲۲۵۳۳۳۲ . 5 عع‎ SEED (BEL) 
data ["NetWorth"] = data ["NetWorth"] .astype (float) 


دعنا الآن نلقي نظرة على أفضل 10 مليارديرات وفقاً لصافي الثروة: 


dE - 0919. 9011۲ 7۵1065 (OV < ] NGEWOFED 1, 

.head (10)‏ (56 02۳21 لمعه و و 

plt.figure(figsize= (20, 10(( 

sns.histplot (x="Name", hue="NetWorth", data=df) 
BLE. 5۳017 )( 


دعنا الآن نلقي نظرة على آهم 5 نطاقات (10112125) تضم أكبر عدد من أصحاب المليارات: 


2 = 0268 ] SOULE CSN [ 232 عع سه‎ )( «ASAE 
index = 2.1006 


sources = a.values 
سه‎ OL COLES = له‎ ۵ SLL EES, FEOMECO لك‎ 
۱ Fed" 1 


))5 , 5) حه2 051 ۶1) هیال ۴1 . 1م 

(601019 لت ۵1019019 , ۱066 921 12061 Pie SOURCES,‏ . 1 
2 وت US,‏ را ات تاد > central Cee le‏ 
() ات ع کس قلع 

رك للك ع نی LAL‏ ع6 ) عت شع 2 د ECE O cO‏ فرط 

OE. EEN LEONE, Sze 12) 

911.111 ) 1352 5 DOMAINS EO BECOME 2 3ظ‎ 1131008116۳۲, 
fontsize=20) 

1911 . 5۳017 )( 


Top 5 Domains with Most Number of Billionaires 


real estate 


pharmaceuticals 


software 


investments 


diversified 


دعنا الآن نلقي نظرة على أفضل 5 صناعات (industries)‏ تضم أكبر عدد من أصحاب 


المليارات: 
EAS)‏ كنم 6ك | ۱۷۲ ۲1۳05 daa‏ و 
index = 2. (‏ 
industries - 5‏ 
Buel,‏ ,۵۳۵۵0۲ ,09۵۵۲ ۷۵1 ر۳۲1۷۵1۱۵۲] > و6010 CUSEOM‏ 
| مه :۱۷ 


((5 57 حه2 ۶1091) هیال ۴1 . 1911 

روده اوه هاوتای‌جو؟ه هه ,00۵۶ وال۱9 ,وفع تا هنال 10) 16 . علاط 

COLO EE)‏ رت OJ,‏ ات تاه = CIECLS‏ ازع 

ا عه عللم - ا 

فلات تت لات که ماو EG OCA) add are‏ 

OE EC LEONEL, Sze 2) 

11.111 ) كرت‎ 5 22615152 215 WEEN MOOSE NUMSEE OE 31ظ‎ 11 0021 165 
fontsize=20) 

1011 . 5۳017 )( 


168 علم البيانات: عن طريق الامثلة 


Top 5 Industries with Most Number of Billionaires 


Technolo 
ی‎ Finance & Investments 


Manufacturing Healthcare 


Fashion & Retail 


دعنا الآن نلقي نظرة على أفضل 5 دول (00111161165) بها أكبر عدد من أصحاب المليارات: 


COUNES )( Head )(‏ ها ۰721 [ ۳00۱0۵۲۴۷۲ ] 0212 > و 
index > a. index‏ 


Countries = a.values 
CUS ۲۵8 COLOES < ۰5۷۵6, م6 م۱0۵0 القت وت‎ 
1 2507 1 


((5 57 حه2 051 ۶1) 2600129 11 

1.16 (CSUR 21 1و 1261 ,وه‎ ۱06 , COLOES=CUSEOM COLOES) 

(( ۲ وه ۲ (OO, OFS USS Color‏ اهامای ازور = قنم‌عدایی لله شع سمه 

() 062 الم ک E1‏ 

عن ل للع ) 6 21۳۳019 ۰.200 () هو . ۶19 

DE EC ۲:۵ ۲ ر‎ Sze 12) 

11.111 LSS 5 COUMEE TES WEN MOSSE MuUMSEeE GE 3ظ‎ EES 
fontsize=20) 

BEE 5۳0 )( 


Top 5 Countries with Most Number of Billionaires 
United States 


Germany 


China Russia 


India 


تحليل المليارديرات مع بايثون 169 


يوضح التصوير أعلاه أن الولايات المتحدة والصين هما البلدان التي يصبح معظم الناس من 
أصحاب المليارات. وهذا يعني أن بيئة الأعمال ومعدل نجاح بدء التشغيل جيد حقافي الولايات 
المتحدة والصين مقارنة ببقية العالم. 


الملخص 

إذن هذه هي الطريقة التي يمكنك بها العثور على أنماط بين المليارديرات حول العالم لتحليل 
بيئة الأعمالفي البلدان. يعتمد نجاح أي شركة أو شركة ناشئة کثیرا على بيئة الأعمالفي بلد ما.في 
نهاية تحليل المليارديرات العالمیین. وجدت أن الصين والولايات المتحدة هما الدولتان اللتان 
لديهما أكبر عدد من الملیاردیرات الأمر الذي يخلص إلى أن بيئة الأعمال ومعدل نجاح شركة 
ناشئة أفضل بكثيرفي الولايات المتحدة والصين مقارنة بالبقية. من العالم. آمل أن تكون قد أحببت 
هذا المقال عن تحليل المليارديرات باستخدام بايثون. 


8 تحليل البطالة مع بایئون 


تحليل البطالة مع بایئون 


Analysis with Python 
وهو‎ )unemploy ne٩۲ 126( تقاس البطالة (1097336126م223[]) من خلال معدل البطالة‎ 
عدد الأشخاص العاطلين عن العمل كنسبة مئوية من إجمالي القوى العاملة. لقد رأينا زيادة حادة‎ 
فى معدل البطالة خلال 00۷10-19. لذا فإن تحليل معدل البطالة يمكن أن يكون مشروعا جيدً‎ 

لعلم البيانات.في هذا المقالة» سوف أخوضكفي مهمة تحليل البطالة مع بايثون. 
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Unemployment 


يتم احتساب معدل البطالة على أساس منطقة معينة. لذلك لتحليل البطالة سأستخدم مجموعة 
بيانات البطالةفي الهند. تحتوي مجموعة البيانات التي أستخدمها هنا على بيانات حول معدل 
البطالةفي الهند خلال 0710-19). فلنبدأ مهمة تحليل البطالة عن طريق استيراد مكتبات بايثون 


ومجموعة البیانات الضرورية: 


1۳001۲ pandas 25 0 


as np 


تا 31۳0۵01۲ 


1 وه ۵101011110۰.۳۵1 1۳001 
فصو import seaborn as‏ 
P<‏ و ۵2016۵98 .۰ 0101۷ عن هلك 


data = 


pd.read csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/unemployment.csv") 
print (data.head () ) 


Region.1 longitude latitude 


79.74 
79.74 
79.74 
79.74 
79.74 


15.9129 
15.9129 
15.9129 
15.9129 
15.9129 


South 
South 
South 
South 
South 


Date Frequency ... 
31-01-2020 M ... 
29-02-2020 M <... 
31-03-2020 M <. 
30-04-2020 M ٠... 
31-05-2020 M ... 


دعونا نرى ما إذا كانت مجموعة البيانات هذه تحتوي على قيم مفقودة أم لا: 


© © © © © © © © ه 


Region 
Andhra Pradesh 
Andhra Pradesh 
Andhra Pradesh 
Andhra Pradesh 
Andhra Pradesh 


sun © 


[5 rows x 9 columns] 


1E E (OEE و‎ SLL )( sS 000 


Region 
Date 


Frequency 


Estimated Unemployment Rate (%) 


Estimated Employed 


Estimated Labour Participation Rate (%) 


Region.1 
longitude 
latitude 
dtype: int64 


علم البيانات: عن طريق الامثلة 171 


أثناء تحليل القيم المفقودة. وجدت أن أسماء الأعمدة غير صحيحة. لذلك. لفهم هذه البيانات 
بشکل آفضل. سأعيد تسمية جميع الأعمدة: 


data.columns= ] ۳5۲۵۲۵5۲ , "Date", "Frequency", 
"Estimated Unemployment Rate", 
"Estimated Employed", 
۲۳51۳۵660 12ت هب‎ 2 2222152152 Ka Ee, 
"55651 ۳۲1۵۴۲01111067, 512006 | 


دعنا الآن نلقى نظرة على الارتباط (طمتاه006ع) بين ميزات مجموعة البيانات هذه: 


111 . 51-۷716 , وتا‎ ('seaborn-whitegrid') 
111 . ۴1 <ه2 ۶1051) هیال‎ )12, 10(( 

sns.heatmap (data.corr () ( 
1911 . 5۳017 )( 


Rute‏ ی 
1 
منود تمسصصت 
| 0 ۱ 
0 
8 ۳ 1 1 7 


تحليل معدل البطالة: تصوير البيانات 
الآن دعنا نتخيل البيانات لتحليل معدل البطالة. سألقي نظرة أولاً على العدد المقدر للموظفين 
وفقًا لمناطق مختلفة من الهند: 


data.columns= ["States", "Date", "Frequency", 
"Estimated Unemployment Rate", "Estimated 
Employed", 
۲۳51۳۵660 تاه هب‎ 22 2111 52612621 ٩216۷ ۳۵۵۲ 
۲1۱0803 2106 ۲, ۲1۵۱1 106 | 
plt.title ("Indian Unemployment") 
sns.histplot (x="Estimated Employed", hue="Region", data=data) 
1011 . 5۳017 )( 
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Indian Unemployment 


دعنا الآن نرى معدل البطالة وفقا لمناطق مختلفة من الهند: 


((10 ,12( <ه2 ۶1051) هیال ۴1 . 1911 

plt.title ("Indian Unemployment") 

sns.histplot (x="Estimated Unemployment Rate", hue="Region", 
data=data) 

1911 . 5۳01 )( 


دعنا الآن ننشی لوحة تحکم لتحلیل معدل البطالة لكل ولاية هندية حسب المنطقة. لهذا؛ 
سأستخدم مخطط sunburst‏ : 
unemploment = 42۵102 ] ["States", "Region", "Estimated‏ 


Unemployment Rate"] [ 
figure = px.sunburst (unemploment, path= ["Region", "States"], 
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values="Estimated Unemployment Rate", 
width=700, height=700, 
هه‎ CORCINUOUS _ 9021 حه‎ 50۷10۳۳, 
title="Unemployment Rate in India") 
figure. show )( 


Unemployment Rate in India 


الملخص 

هذه هي الطريقة التي يمكنك بها تحليل معدل البطالة باستخدام لغة برمجة بايثون. تقاس البطالة 
من خلال معدل البطالة وهو عدد الأشخاص العاطلين عن العمل كنسبة مئوية من إجمالي القوى 
العاملة. أتمنى أن تكون قد أحببت هذا المقال حول تحليل معدل البطالة باستخدام بايثون. 
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WhatsApp مع بایئون‎ WhatsApp تحليل دردشة‎ 9 
Chat Analysis with Python 


۵۸۲ هو أحد تطبيقات المراسلة الأكثر استخدامًا اليوم مع أكثر من 2 مليار مستخدم 
حول العالم. تم العثور على أكثر من 65 مليار رسالة يتم إرسالها على ه7712 يوميًا حتى 
نتمكن من استخدام محادثات WhatsApp‏ لتحليل الدردشة مع صديق أو عميل أو مجموعة 
من الأشخاص.في هذه المقالة. سوف أطلعك على مهمة تحليل دردشة ۱۷۵05/۸00 مع بايثون. 
تحليل دردشة ۱۷۷2/6۸00 
يمكنك استخدام بیانات ۷/۵۵۵0 الخاصة بك للعدید من مهام علم البیانات مثل تحلیل 
المشاعر (212217515 عصعحصتجعه) واستخراج الکلمات الرئيسية (keyword extraction)‏ 
والتعرف على الکیانات المسماة (0منانطع0عع۲ entity‏ dمnam)‏ وتحلیل النص والعدید من 
مهام معالجة اللغة الطبيعية (ع71066551 1311511286 1211121) الأخرى. یعتمد ذلك أيضًا على 
من تقوم بتحليل رسائل 1۷۵۲۵۸:00 الخاصة بك لأنه يمكنك العثور على الكثير من المعلومات 
من رسائل 125/۸0۲ الخاصة بك والتي يمكن أن تساعدك أيضاني حل مشاكل العمل. 
قبل البدءفي مهمة تحليل ۳26) ۷/۳۵0۵ مع بايثون. تحتاج إلى استخراج بيانات 
۷۷۳2۲۹۵0 الخاصة بك من هاتفك الذكي وهي مهمة سهلة للغاية. لاستخراج محادثات 
م Wht‏ الخاصة بك. فقط افتح أي دردشة مع شخص أو مجموعة واتبع الخطوات 
المذكورة أدناه: 

1. إذاكان لديك جهاز 08ط فانقر فوق اسم جهة الاتصال (عصعل Contact‏ ) أو 

اسم المجموعة «عصعلط م601 ). إذا كان لديك هاتف ذكي يعمل بنظام 
24 ة. فانقر فوق النقاط الثلاث أعلاه. 

2 ثم قم بالتمرير إلى الأسفل والأعلىفي تصدير الدردشة (20ط) 016م:8). 

3. ثم حدد بدون وسائط للبساطة إذا سألك ما إذاكنت تريد محادثاتك مع أو بدون وسائط. 

4. ثم أرسل هذه الدردشة بالبريد الإلكتروني إلى نفسك وقم بتنزيلها على نظامك. 
هذه هي الطريقة التي يمكنك بها بسهولة إجراء محادثات ۷۷۵9۸0 الخاصة بك مع أي 


شخص أو مجموعة لمهمة تحليل دردشة ممه17712.في القسم آدناه. سوف آخذك عبر تحليل 
دردشة ۷۷265۸00 مع بايثون. 


عله یت ریق مد 


تحلیل دردشة 2600 ۷۷ مع بایئون 

آمل أن تکون قد فهمت الان كيفية الحصول على بیانات ۷7205۸0 الخاصة بك لمهمة تحلیل 
دردشة WhatsApp‏ مع بايثون. لنبداً الآن هذه المهمة عن طریق استیراد مکتبات بايثون 
الضرورية التي نحتاجها لهذه المهمة: 


import regex 

0 وه 2202-5 11۳001 

311۳0۵0 6 0817 aS م‎ 

11020258 1 

۶018 COL امت‎ ONS EMOOEE COURECE 

1 10۳0 وج عت لمان 1۵10101011 عاط0‎ PE 

Er OM ۵1۴061 01۲0 او وید‎ ۲۱۲۵1001018, 910۳0۵51۲5, 
1112 06001 010661۴6۳11 01 


تتطلب مجموعة البیانات التي نستخدمها هنا الکثیر من التحضیر (213602مع2م).: لذا آقترح 
عليك إلقاء نظرة على البیانات التي تستخدمها قبل بدء مهمة تحلیل الدردشة عبر 50اه /۱. 
نظرًا لأنني قمت بالفعل بتصفح مجموعة البیانات. سأبدأ بکتابة بعض دوال بایثون لاعداد 
البیانات قبل استیرادها: 


def Gale me (SJE: 
م 0 ۱۸ 00 0 1 ۱۵۳۹۵ ۷۰ > للع عدم‎ ۱ 
8 زر‎ OO SI IEAM EM و لدت كت‎ > 
result = regex.match (pattern, 5( 
31۶ ومد‎ : 
return True 
return False 


06۶ ۶100 ع‎ ) : 
5 - SSE) 
1 ۶ len )5( <<2 : 
return True 
else: 
return False 


def getDatapoint (line) : 
[013111316 > 11۳6 SI E - -( 
021611۳86 = 911و‎ 11۳6 [0] 


date, time = 4216115۳6. 50131 )۲, ") 
message = " ".join(splitline[1:]) 
iE Eind میاه‎ (message) : 
splitmessage = message.split(": ") 
author = splitmessage [0] 
message = " ".join(splitmessage ]1:[( 
else: 


author= None 
return date, time, author, message 


دعنا الآن نستورد البيانات ونجهزها بطريقة يمكننا استخدامهاني إطار بيانات 221025: 


data = [|] 
COR VUEESAEEON - 0022625 قطن 8ك‎ WIEN 52523 EXEL 
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wı EM Open (conversation, GCNCOdING- UE OL) و2‎ EO: 
fp.readline )( 
messageBuffer = [|] 
date, time, author = None, None, Non 
while True: 


line = fp.readline() 
i MOE MES 
break 


line = line.strip() 

1۶ ها‎ ۲1106 (EJ : 
31 ۶ len (messageBuffer) > 0: 

data.append ([date, time, author, ' 
'.join (messageBuffer) ]) 

messageBuffer.clear () 
date, time, author, message = getDatapoint (line) 
messageBuffer.append (message) 

else: 
messageBuffer.append (line) 


مجموعة البيانات الخاصة بنا جاهزة تمامًا الآن لمهمة تحليل دردشة ۷۷26۵۸0۲ باستخدام 
بايثون. دعنا الآن نلقى نظرة على آخر 20 رسالة وبعض الأفكار الأخرى من البيانات: 


df = pd.DataFrame (data, columns= ["Date", 'Time', 'Author'", 
"Message']) 

El BEES] = OO CE COLE e (CE DES ب(‎ 

EE ROLE o ALL (AU) 

OE EME (OLE RES )( لا‎ 

11 )0۶ ۰ ۸۱ ۲0 ۰ UNS GUC (J) 


Date Time Author Message 
1285 2021-07-01 8:23 pm Aman Kharmwal © 
1286 2021-08-1 1:12 am Sapna Are you taking the class tomorrow 
1287 2021-08-1 1:14 am Aman ۷۵۲۸۵۱ No 
1288 2021-08-1 1:14 am Aman Khawal Are you? 
1289 2021-08-01 10:24 am Sapna Hahhahah. © © 
1290 2021-08-01 10:31 am Aman Kharwal ۵ 
1291 2021-08-01 8:28pm None Aman Kharwal: https:/iwww.youtube.com/watch?v=, 
1292 2021-08-01 8:29 pm Aman Kharwal hope you like it 
1293 2021-08-01 8:43pm Sapna Congratulations © © 
1294 2021-08-01 8:43 pm Sapna I'll watch 10 
1295 ۰ 2021-08-01 8:45 pm Aman Kharwal Thanks 0 
1296 2021-08-01 8:46 pm Sapna © © 
1297 2021-09-01 10:26 am Sapna U.S politics has taken an interesting turn 
1298 2021-09-01 10:26 am Sapna Fun to watch the mockery 
1299 2021-09-01 10:35 am Aman Kharwal ۷۰۶0 


1300 2021-09-01 4:54 pm Aman Kharwal Do you know we can also analyse the whatsapp ۰ 


1301 2021-09-01 4:54 pm Aman Kharwal © 
1302 2021-09-1 5:54 pm Sapna This is interesting 
1303 2021-09-1 5:54 pm Sapna Do share the code 
1304 2021-09-01 5:54 pm Sapna © © 


الآن دعنا نلقي نظرة على العدد الإجمالي للرسائل بين دردشة ۱۷/25۸0 هذه: 
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total_messages = 4۶ . [0اهصحطهو‎ 
۳111 )۲0۲81 1065 52965( 


1288 


الآن دعنا نستخرج الرموز التعبيرية (720[15©) الموجودة بين الدردشات ونلقي نظرة على الرموز 
التعبيرية الموجودةفي هذه الدردشة: 


GEE SOLE _ CONE ESSE) ¢ 
EOL LISE < [I 
data = regex.findall (r'\X', text) 
OE WOO انراد‎ 2 : 
if anv(enar in emeji :UNTCODE 511001 for طدتك‎ iN WOE): 
EMO lise. 95882214 (WOES) 
EEUU SMO E MESE 
dE emen ۲ ( جح‎ dt 11255962610 ور زولوزی.‎ COUN) 


emojis = sum (df ['emo]ji'].str.len()) 
911 ME AO AS) 


367 


دعنا الآن نستخرج عناوين 0۸1 الموجودةفي هذه الدردشة ونلقي نظرة على الإحصاءات 
النهائية: 


17512۲۲۳858 MEE IS ۲ 


0۶ | ۲۱۲16۵0۳۸۲۲ [ . 42 Message , 2۳001 7 )1 525203 ۶ 
1096. 2120311 (URLPATTERN, x)).str.len )( 
13118 = MP SUM SE (حاصناهم 1 2ن‎ 


print ("Chats between Aman and Sapna") 

۳11۳1 )۲۲۵۲۵1 Messages "۲, ۵21 Mess 3e9) 
111 ) 110612 ۶ه‎ Media Shared: ۲, Media 165 52965( 
911 ۲وطلصت۲(۲)‎ OE EMO AS 521760۲, CMON LS) 

print ("Number of Links Shared", links) 


Chats between Aman and Sapna 
Total Messages: 1288 

Number of Media Shared: 11 
Number of Emojis Shared 367 
Number of Links Shared 1 


دعنا الآن نجهز هذه البيانات للحصول على مزيد من الأفكار لتحليل جميع الرسائل المرسلةفي 
هذه الدردشة بمزيد من التفصيل: 


media 769 269 0۶ < dE ]0۶ ] ۲1۷۵99206۲ [ < تك‎ 0۳03 ۲۲60<۲[ 
messages QE < 0۶ . هت‎ (media 169 29695 Qf ۰ 1۳06( 

ح [ 0۳0۳8۲ ۲6/۲61 ۱ 0۳ 52065 1865 

((5) طع1 : 5 0طصع1) 7 91 . [ ۲ ۲۲6۵95206 ] 0۶ messages‏ 


178 
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1085 2965 0۶ Nord 0010۳8 ۲[ 
messages QE Message [ . 201 و) 160 : و 202ع1)‎ . 901311 )۲ ۲((( 
messages 0۶ ] ۲۲6۵55306001۳7 ۲ [ 21 


1 = ["Aman Kharwal", "Sapna"] 
EOE 1 an 22206 ض!)‎ )1( ( : 
Filtering out messages of particular user 
۲60 شك‎ 7 16552969 0۴ Messages 0۶ [| AuEROEL | << N 
۲60 غك‎ MiN 0۵82110 169529695 OE ORI One وتا ونان 1و‎ 
ELE NE SEES CE (LIZ), او‎ 
shape will print number of rows which indirectly means th 
number of messages 
۳1۳11 ) Messages 56۳81۲ , 16_0۶ . 91206 ]01[( 
Word Count Contains Of 66211 words in One message. SUM OE 
all words/ Total Messages will yield words per message 
10105 Ber message = 
(np.sum (req df ۲ ۲۲۲۵۲۵0 Count']))/req df.shape [0] 
۳111 ) Average ۲۵۲05 061 ۳0699206۲ , 109 Ber 1695 296( 
#media conists of media messages 
186012 = media messages QE [media messages df ] ۲۸ 0۲۲ | = 
1 ]3 [ [ .shape [0] 
print ) ۲۲603 2۵ Messages Sent', media) 
# emojis conists of total emojis 
mon tS > SUM Ee QE ll 21155321 Il SCE LO )) 
PEA ME ) LEMONS SORE, CMOS) 
۲1118 CON SHS GE EOE 9ص‎ 
۱۱۳۳۵ SS SUMNEES QE تروك لاضن ا‎ I) 
ES Sene عاونا‎ 


Stats of Aman Kharwal - 

Messages Sent 687 

Average Words per message 1 
Media Messages Sent 9 

Emojis Sent 228 

Links Sent 1 


Stats of Sapna - 

Messages Sent 0 

Average Words per message 6.3830508474576275 
Media Messages Sent 2 

Emojis Sent 139 

Links Sent 8 


EOL CMO 15 MESE = 11 2815 (SOE (E FOE ۱۵ 2 MOSSES CEOS EOL 
32 هد‎ 0(7 


COMO S ESE)‏ او تاهتا) 16۵ > emo HS‏ تاو تا 


Em 162555286657 OE MONE EOF 3‏ ها SEA EOE‏ تاه 1 و ۱۵ج او عه 
اك اه 
ات كنتيات ) EMO Gere > OE ERESUMEE E‏ 
kKevlamoda x XL,‏ , () 0160۰161۳08 1مه) 501۳660 > 0101 EMO‏ 
Se > E UE)‏ 6۲ 16۷7 
OE 1 I CUO CAGES‏ 

OEE (E) 


,۲6۳۵17 ] حوصصالهی رام 0 1[مصه) مر ۵۳] 0۰۳۲2 > emo QE‏ 
| ال 
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import plotly.express as Px 

eMONT QE, Ualues= COUNE ۲ , MaMes< CMO |)‏ ۶.۳16 < ولط 
(EOS ۲0091 61 01 ۲1051067,‏ ۲۵6۵5 ۵02۲6 . ۴1 
textinfo='percent+tlabel')‏ 

۶1 0 . 5107 )( 


© © 4 © © © ۵۲ © © © 6 


دعنا الآن نلقي نظرة على الکلمات الا کثر استخدامّافي دردشة ۷۷۳26۸00 هذه من خلال رسم 
سحابة الکلمات :)word cloud)‏ 


a‏ ف AAD‏ ع 


cist leal rn 
ON 


8 00 


an )eet 


- و‎ 
0 5900) از‎ rrr start nee 01 


کا کن ا ا ر ی ا ا 
مختلفتين من الكلمات: 


1 = ["Aman Kharwal", "Sapna"] 

for i in range (len(l)): 
dumny dE > messages 0۶ [messages 0۶ ] ۲2۸0۲۲ ll — 1 ]11 [ 
۲64] << ۲ I OIM(review EOE ۵71 هم‎ in بت‎ 0۶ Message) 


stopwords = set (STOPWORDS) 
#Generate a word cloud image 
PERE ) نت عات‎ mame III 
wordcloud = WordCloud (stopwords=stopwords, 
3 0160۲01780 Color >I whi cel) geme ra le (lex E) 
#Display the generated image 
111 2150122) 212955125 )10,5(( 
plt.imshow (wordcloud, interpolation='bilinear') 
OE aS SOLS EE N) 
1011 . 5۳01 )( 


180 تحليل دردشة ۷۷۰۵۱۲۶۸۵0 مع بايثون 


! 0۱۷/۲۱۵۱۲۲ سم ی‎ 
8 9 ` „start 
- مه‎ want 3 a ۷ 
۳ C> 


ggline 2 ۲ Meed= ۹ work 
ا‎ Machinë و‎ i Thanks 
tıme..., E ev very ythi ine @ 0 


cour se“ 


۷[ رس 
file > ‘Understand ure‏ : 6۵0 
سر lear, : book‏ و لمع claşşes‏ =„ 

nore even ف‎ 
1 E code 0 2 ey 
8 مور وی‎ : projec 
۳۱ ually = ۵۲۱۵ business ۳ سپ‎ 


Author name Aman Kharwal 


ete 


! لام‎ 012 0 1 3 e 


20 ne : want 3 feed work 
oogle 
n Machjnë ۳ j Thanks 


22106 4 ever) yth ing 1 
| سح رت‎ NOW 
hope سس‎ 


5 
ام‎ ‘Understand vure 
„ claşşes ۳ 


س 


0 
2 learn ۳۹ 
سیم‎ even تر‎ ۱ 
0 H1 ۴ code diris! 
+ * Whenever 
>» pro 0 5 
0 الي‎ NK, بس‎ ON@ business 9 1 ın web 


Author name Sapna 


الملخص 

هذه هي الطريقة التي يمكننا بها بسهولة تحليل أي دردشة 1۷۳209۸0 بينك وبين صديقك أو 
عميلك أو حتى مجموعة من الأشخاص. يمكنك أيضًا استخدام هذه البياناتفي العديد من المهام 
الأخرى الخاصة بمعالجة اللغة الطبيعية. أتمنى أن تكون قد أحببت هذه المقالة حول مهمة تحليل 
دردشة ۷۷۸65۸00 مع بايثون. 
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0 تحلیل المشاعر فی دردشة ۷۲2۲۸۵0۵ باستخدام 
بایئون WhatsApp Chat Sentiment Analysis using‏ 
Python‏ 

يعد ۷7۵۸۵00 مصدرًا رائعًا للبيانات لتحليل العديد من الأنماط والعلاقات بين شخصين أو 
أكثر يتحدثون شخصيًا أو حتىفي مجموعات. إذا كنت تريد أن تعرف كيف يمكننا تحليل مشاعر 
دردشة ۰/26۸0 فهذه المقالة مناسبة لك.في هذه المقالة» سوف أطلعك على مهمة تحليل 
المشاعرني دردشة :۷7209۸ باستخدام بايثون. 


تحلیل المشاعر دردشة ۱۷۷20/۸۵0 

لتحليل مشاعر دردشة ۰۷۷/۵05۸00 نحتاج إلى جمع البیانات من مم77254. يجب أن 
يستخدم معظمكم تطبيق المراسلة هذاء لذلك لجمع البيانات حول الدردشة. ما عليك سوى اتباع 
الخطوات المذكورة أدناه: 


1. للايفون: 
1. افتح الدردشة الخاصة بك مع شخص أو مجموعة. 
2. فقط اضغط على ملف تعريف الشخص أو المجموعة. 
3. سترى خيارًا لتصدير الدردشة بالأسفل. 

4. لأجهزة الأندرويد: 
1. افتح الدردشة الخاصة بك مع شخص أو مجموعة. 
2 انقر فوق النقاط الثلاث أعلاه. 
3 انقر فوق المزید. 
4 انقر فوق دردشة التصدیر. 


ستری خيارًا لارفاق الوسائط آثناء تصدیر الدردشة. من أجل البساطة. من الأفضل عدم إرفاق 
الوسائط. آخیرا؛ آدخل بریدك الالکترونی وستجد دردشة 7۳209۸0 ني صندوق الوارد الخاص 
بك. 
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تحلیل مشاعر الدردشة عبر ۷۷۳۲2۷۶/۸0 باستخدام بایئون 

لنبدأ الآن بمهمة تحلیل مشاعر الدردشة عبر 17112654 باستخدام بايثون. سأبدأ هذه المهمة 
بتحدید بعض الوظائف المساعدة لأن البیانات التي نحصل علیها من 1۷۳۵09۸0۲ ليست 
مجموعة بیانات جاهزة للاستخدام‌في أي نوع من مهام علم البیانات. لذلك. لاعداد بياناتك لمهمة 
تحلیل المشاعر. ما عليك سوی تحدید جمیع الدوال على النحو المحدد آدناه: 


import re 

0 وه 52220125 1۳0011۲ 

31۳00 متا‎ aS NP 

import emoj i 

۶018 COlleCEI ONS EMOOE E COURNECE 

1 وه ۰0۷۵10۲ 1۵101011110 1۳001 

from PIL import Image 

۶101۲ 65 260 تا ۲۲۵001 0562 16ت‎ SEOEVNORDS , 
ImageColorGenerator 


۲ Extract Lime 
def date Me )۵(( 5 

82122720 = FOIE) ۱/۱ ۱۱۵۵ LD CEOS), CIOS 
50: ) ۱ 9 ۲ ( ۱ IEAM EM 2۳0 OMS -' 

result = re.match (pattern, 5( 

1 ۶ 109111 : 

return True 
return False 


# Find Authors or Contacts 
GEE EOC AVEO (EY و‎ 
5 - SSE LD 
1 ۶ len (s)==2: 
return True 
else: 
return False 


# Finding Messages 

def getDatapoint (line) : 
برد‎ 11256 > lie Sol تا‎ — 1 
dateTime = splitline [0] 


date, time = 421611۳6. 501311 )۲, ") 
message = " ".join(splitline[1:]) 
1۶ ERG ایام‎ ME SS Ade) : 
splitmessage = message.split(": ") 
author = splitmessage [0] 
message = " ".join(splitmessage ]1:[( 
else: 


author= None 
return date, time, author, message 


لا يهم إذاكنت تستخدم مجموعة بيانات دردشة جماعية أو محادثتك مع شخص واحد. ستعمل 
جميع الدوال المحددة أعلاه على إعداد بياناتك لمهمة تحليل المشاعر وأي مهمة تتعلق بعلم 
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البيانات. الآن إليك كيف يمكننا إعداد البيانات التي جمعناها من ۷/265/۸00 باستخدام الدوال 
المذکورة آعلاه: 


data = ][ 
COREE SAE HORN = WMaAESADP قطن‎ WIEN 5222122: EXEL 
with open (conversation, encoding="utf-8") as fp: 
fp.readline () 
messageBuffer = [|] 
date, time, author = None, None, Non 
while True: 


line = fp.readline() 
E MOE 1/11 
break 


line = line.strip )( 

E Gace time Re E 
1 ۶ len (messageBuffer) > 0: 

data.append ([date, time, author, ' 
'.join (messageBuffer) [( 

messageBuffer.clear () 
date, time, author, message = getDatapoint (line) 
messageBuffer.append (message) 

else: 
messageBuffer.append (line) 


الآن إليك كيف یمکننا تحليل مشاعر دردشة ۷205/0۲ باستخدام بايثون: 


df = pd.DataFrame (data, columns= ["Date", 'Time', 'Author'", 


۲ 652061 ]) 

0۶ ] ۲۲۵۲۵۲ [ = 00۰۳002۲6۳011706 (dE ] Date ll) 

data = 0۶ . 1100۳82 )( 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer )( 

da eal EOS اه تا‎ = SENE و‎ POLAT EY SCOEE SM) Bos Eo ان‎ 
in data ["Message"] ] 

ند COE‏ | لكك | ۱۰ كع سم عد EY‏ سیر و۱ < | vel‏ ۱۳۱۱6۵9 9 619 
in data ["Message"] ]‏ 

Clee @ | NEUE دمع‎ 01 3 (SSNEIMENES هت لوزن‎ LEY SEOLES REY Yeu Eo 1 


in data ["Message"] ] 
print (data.head() ) 


Date Time Author ... Positive Negative Neutral 
6 2020-04-06 12:36 pm Sapna ... 0.0 6.08 1.000 
1 2020-04-06 12:36 pm Sapna ... 0.0 0.000 1.000 
2 2020-04-06 12:54 pm Aman Kharwal ... 0.0 6.666 1.000 
3 2020-04-06 12:55 pm Sapna ... 62.8 0.383 0.617 
4 2626-04-6 1:66 pm Aman Kharwal ... 0.0 6.666 1,8 


x = sum (data["Positive"]) 
y = sum (data["Negative"] ) 
2 = sum (data ["Neutral"] ) 


def Sentiment )هد‎ O, O: 
1۶ 8D) ANS (OC) 


لا @ 21 ۵ ) 1۳ 1911 
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CITE )5-3( and (BEES 


print ("Negative ا‎ 
else: 


print ("Neutral © يا‎ 
sentiment_score (x, ۷, 2( 


Output: 
Neutral @ 


لذاء فإن البيانات التي استخدمتها تشير إلى أن معظم الرسائل بيني وبين الشخص الآخر محايدة 
.(neutral))‏ مما يعني أنه ليس إيجابيًا (positive)‏ أو شلا .(negative)‏ 


الملخص 

إذن هذه هي الطريقة التي يمكننا بها أداء مهمة تحليل المشاعرفي دردشة ۰۷۷26۵۸0۲ يعد 
Wh‏ مصدرًا رائعًا للبیانات لمهمة تحليل المشاعر وكل مهمةني علم البيانات تعتمد على 
معالجة اللغة الطبيعية. آمل أن تكون قد أحببت هذه المقالة حول مهمة تحليل المشاعرفي دردشة 
۷/200 باستخدام بايثون. 


تحلیل لقاحات 601710-19 باستخدام بایئون 183 


2 تحلیل لقاحات 007:0-19 باستخدام بایئون -00711 


19 Vaccines Analysis with Python 
عن السيطرة. حتى بعد الإغلاق. أدى ذلك إلى زيادة‎ ٥٥14-19 كان هناك وقت خرج فيه‎ 
سريعةفي الحالات حيث تمت السيطرة على بعض الحالاتفي بعض البلدان ولكن تمت التضحية‎ 
بالاقتصاد.في مثل هذه الحالة. يُنظر إلى اللقاحات (7261:60) فقط على أنها الأداة الوحيدة التي‎ 
يمكن أن تساعد العالمفي مكافحة فيروس كورونا.في هذه المقالةء سوف أطلعك على مهمة تحليل‎ 

لقاحات 20710-19) باستخدام بايثون. 


تحليل لقاحات 205710-19) 

تم تقديم العديد من اللقاحات حتى الآن لمحاربة 0۷10-19). لا يوجد لقاح يضمن دقة 100/ 
حتى الآنء لكن معظم الشركات المصنعة تدعي أن لقاحها ليس دقيقًا بنسبة ۰/100 ولكن مع 
ذلك. فإنه سينقذ حياتك من خلال إعطائك مناعة. 


وهكذاء يحاول کل بلد تطعيم جزء كبير من سكانه حتى لا يعتمد على لقاح واحد. هذا ما سأقوم 
بتحليلهفي هذه المقالة» وهو عدد اللقاحات التي تستخدمها كل دولة لمحاربة 00510-19).في 
القسم أدناهء سوف آخذك من خلال برنامج تعليمي لعلم البيانات حول تحليل لقاحات -605710© 
9 باستخدام بايثون. 


مجموعة البيانات التي سأستخدمها هنا لمهمة تحليل لقاحات 6071-19 مأخوذة من #اععهK.‏ 
لنيدا باستیراد مکتبات بايثون ومجموعة البيانات الضرورية: 


311۳00 6 0817 aS NP 

import pandas as pd 

1 وه ۵1010113110.0۷۵ 1۳0011 

import seaborn as 5 

02168 > 0.1680 CSV )۲ 60۵111 ۲72060189 21 085 ESV) 
data. head )( 


country iso_code date total_vaccinations people_vaccinated people_fully_vaccinated daily_vaccinations_raw daily_vaccinations 


0 Afghanistan AFG a 0.0 0.0 NaN NaN NaN 

2021- ۳۳۳۹ 
1 Afghanistan AFG چ‎ NaN NaN NaN NaN 1367.0 
2 Afghanistan وعم‎ 0 NaN NaN NaN NaN 1367.0 


NaN NaN NaN NaN 1367.0 


4 Afghanistan AFG میس‎ 26 NaN NaN NaN NaN 1367.0 
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دعنا الآن نستکشف هذه البیانات قبل أن نبدأفي تحلیل اللقاحات التی تأخذها البلدان: 


0212 ۰. 0650111060 


total_vaccinations people_vaccinated people_fully_vaccinated daily_vaccinations_raw daily_vaccinations total_vaccinations_per_hundred 


count 6.575000e+03 5.926000+03 422000703 5507000903 1.069500+04 6575.000000 
mean 3.6303726+06 2.5858106+06 1.175809e+06 1.1926506+05 7 .0481246+04 2.295927 
std 1.396665e+07 9.0137116+06 4.86011086+06 4.4208166+05 2.9887616+05 2069 
min 0.000000e+00 0,0000006+00 1.000000e+00 -2.9286006+04 0.0000006+00 0.000000 
25% 5.1598506+04 4.8806506+04 2.2081006+04 3.1715006+03 9.8750006+02 0.970000 
50% 3.4599406+05 2.9258956+05 1.4743806+05 1.5301006+04 6.0010006+03 4.720000 
15% 1.6055426+06 1.1991986+06 5.776635e+05 5.9601506+04 2.7998006+04 14.615000 
max 1.8346776+08 1.1714296+08 7.0692646+7 7.1850008+06 5.1901436+06 188.990000 


0۰0_08611106 )02 2 dale) 
0312 ۰ 60۱1۷ Ma Ue و صنامع‎ )( 


United Kingdom 118 
Northern Ireland 118 
Wales 118 
England 118 
Canada 118 
Mali 4 
Bahamas 2 
Brunei 2 
Laos 1 
Armenia 1 


Name: country, Length: 175, dtype: 4 


تتكون المملكة المتحدة من إنجلترا واسکتلندا وويلز وأيرلندا الشمالية. ولكن في البيانات آعلاه. 
تم ذكر هذه البلدان بشكل منفصل بنفس القيم كمافي المملكة المتحدة. لذلك قد يكون هذا خطأ 
آثناء تسجيل هذه البيانات. لذلك دعونا نرى كيف يمكننا إصلاح هذا الخطأ: 


x: x MOE im ] ۲5۰۵1۵۳00۲‏ 2ك ظاكرت !) 2091۲ . سدع 21 مت :2 01262 dalal‏ > 02522 
[ | 2د لات عط ۲۲۵11۵11 ,۲۷۲۵1۵5۳۲ ,۲96012۳0۳7 


data. Coun ERY. Va lue 661125-50 


Canada 118 
United Kingdom 118 
China 117 
Russia 117 
Israel 113 
Mali 4 
Bahamas 2 
Brunei 2 
305 1 
Armenia 1 


Name: country, Length: 171, dtype: 4‏ 
دعنا الآن نستكشف اللقاحات المتوفرةفي مجموعة البيانات هذه: 


0383: 73 2622125 value 25ت‎ 


نسم 
00 
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Moderna, Oxford/AstraZeneca, Pfizer/BioNTech 2587 
Oxford/AstraZeneca 1673 
Pfizer/BioNTech 1416 
Oxford/AstraZeneca, Pfizer/BioNTech 845 
Pfizer/BioNTech, Sinovac 475 
Moderna, Pfizer/BioNTech 407 
Sputnik V 251 
Oxford/AstraZeneca, 6 301 
Oxford/AstraZeneca, Sinopharm/Beijing 268 
Oxford/AstraZeneca, Sinopharm/Beijing, Sputnik V 235 
Pfizer/BioNTech, Sinopharm/Beijing 208 
Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sputnik ۷ 202 
Sinopharm/Bei jing 186 
Oxford/AstraZeneca, Pfizer/BioNTech, Sinovac 123 
Sinopharm/Beijing, Sinopharm/Wuhan, Sinovac 117 
EpiVacCorona, Sputnik V 117 
Johnson&Johnson, Moderna, Pfizer/BioNTech 132 
Oxford/AstraZeneca, Pfizer/BioNTech, Sinovac, Sputnik لا‎ 108 
Moderna, Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sputnik لا‎ 104 
Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sinopharm/Wuhan, Sputnik لا‎ 96 
Covaxin, Oxford/AstraZeneca 86 
Sinovac 84 
Moderna, Oxford/AstraZeneca 79 
Oxford/AstraZeneca, Sinopharm/Beijing, Sinovac 61 
Johnson&Johnson 54 
Sinopharm/Beijing, Sputnik V 51 
Pfizer/BioNTech, Sputnik V 42 
Pfizer/BioNTech, Sinovac, Sputnik V 29 


Name: vaccines, dtype: int64 


إذن لدينا جميع لقاحات 007104-19 تقريبًا متوفرةفي مجموعة البيانات هذه. الآن سوف آقوم 
بإنشاء إطار بيانات جديد من خلال اختيار أعمدة اللقاح )vaccine(‏ والدولة رحتصاهمع) فقط 
لاستكشاف اللقاح الذي يتم تناولهفي أي دولة: 


dE < 049521] VACCINES, 62ت‎ [ 


01۶ 16200 
ما‎ vaccines country 
0 Oxford/AstraZeneca Afghanistan 
1 Oxford/AstraZzeneca Afghanistan 
2 Oxford/AstraZeneca Afghanistan 
3 Oxford/AstraZeneca Afghanistan 
4 Oxford/AstraZzeneca Afghanistan 
دعنا الآن نرى عدد البلدان التى تأخذ كل اللقاحات المذكورةفي هذه البيانات:‎ 
de E < 


EOE 1 لكل‎ GE VACCINES UR TOMES 
deê [ILI = (AE م۵۵‎ I رد‎ [ EOC J a 
df [df ["vaccines"]==i1] .index] 
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vaccines = {} 
EOE ۵۷, VALUE A CIGE oS )( 5 
vaccines [key] = set (value) 


EOE رد‎ dd 111 ۷۵0۵011۵5 116108 )( ۶ 
DENE دده ات‎ 


Oxford/AstraZeneca: <<) ۲620012  ر‎ ۱۱۱۵101۷65" ر "130218" ر‎ "۹230۴ Lucia’, 'Myanmar', 'Barbados', 
۲8۳۷0۵۶2 ر "68202 ر "۲080" و‎ 'Mauritius', 'Malawi', ‘Antigua and Barbuda’, ۱6۵۵1" و "2۳003ول۱ و ۲21030" و‎ 
۰82۳020۵5 , 'Vietnam', 'Eswatini', ‘Saint Helena', ۲۵۱۵۵132 و"‎ 'Kenya', "Cote d'Ivoire", ۲۱۵1۵0۷2" و‎ 
"Trinidad and Tobago', 'Uzbekistan', 'Mali', 'Botswana', 'Bangladesh', 'Falkland Islands', 
'Suriname', 'Ukraine', 'Papua New Guinea', 'Afghanistan', 'Sierra Leone', 'Sudan', 'Nigeria', 
'Belize', 'Grenada', 'Montserrat', 'Kosovo', 'Sri Lanka', 'Georgia', 'Bhutan', 'Saint Kitts and 
Nevis', 'Solomon Islands', 'Angola', 'Guyana', 'Sao Tome and Principe', 'Cape Verde', ۰0۵010362 ر‎ 
"Saint Vincent and the Grenadines', 'Anguilla'} 

Pfizer/BioNTech, Sinovac:>>{'Colombia', 'Malaysia', 'Uruguay', 'Albania', 'Chile', 'Turkey', 'Hong 
Kong’ } 

Sputnik V:>>{'Guinea', 'Iran', 'Paraguay', 'Kazakhstan', 'Algeria', 'Syria', 'Belarus’', 'Armenia', 
'Venezuela'} 

Pfizer/BioNTech: >>{'Cayman Islands', 'Greenland’', ‘Monaco’, 'Andorra', 'Gibraltar', 'Lebanon', ۳۷6 
and Caicos 1513005, 'Panama', 'Japan', ‘North Macedonia', "2۲3۳ رو‎ 'Cyprus', 'Bermuda', 'Slovakia', 
"Ecuador', 'New Zealand', 'Costa Rica', 'Kuwait'} 

Oxford/AstraZeneca, Sinopharm/Beijing, Sputnik V:>>{'Argentina', 'Pakistan', 'Bolivia'} 
Oxford/AstraZeneca, Pfizer/BioNTech:>>{ 'Australia', 'United Kingdom', 'Jersey', '1516 of Man', ام‎ 
Korea', 'Sweden', 'Slovenia', 'Guernsey', 'Oman', 'Saudi Arabia'} 

Moderna, Oxford/AstraZeneca, Pfizer/BioNTech: <<) 'Austria', 'Rwanda', 'Canada', ‘Belgium’, 
'"Lithuania', 'France', 'Germany', ‘Spain’, 'Latvia', 'Estonia', 'Ireland', 'Norway', 'Luxembourg', 
'Netherlands', "1۳21۷" ر‎ 'Malta', 'Czechia', ‘'Iceland', 'Palestine', "۳۵8۵12۵ و‎ 'Denmark', 'Greece', 
ار ار را ار(‎ 

5100۷26: 'Azerbaijan'} 

Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sputnik V:>>{'Serbia', 'Bahrain'} 
Oxford/AstraZeneca, Sinovac:>>{'Brazil', 'Dominican Republic', 'Indonesia', 'Philippines', 
'Thailand’'} 

Oxford/AstraZeneca, Sinopharm/Beijing, Sinovac: >>{'Cambodia' } 

Sinopharm/Beijing, Sinopharm/Wuhan, Sinovac:>>{ 'China’'} 

Oxford/AstraZeneca, Sinopharm/Beijing:>>{'Iraq', 'Morocco', 'Seychelles', 'Egypt'} 
Oxford/AstraZeneca, Pfizer/BioNTech, Sinovac:>>{ 'Northern Cyprus’, ' 1ع‎ Salvador’'} 
Sinopharm/Beijing: <<) ' Equatorial Guinea’, 'Mauritania', 'Senegal', 'Zimbabwe', 'Gabon', 'Kyrgyzstan', 


'Namibia', 'Mozambique' } 
Moderna, Pfizer/BioNTech: >>{' Liechtenstein’, ۲26۳۵۵ Islands', 'Israel', 'Switzerland', 'Singapore'} 


Moderna, Oxford/AstraZeneca: <<) ' Honduras ', 'Guatemala'} 

Moderna, Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sputnik V:>>{ ‘Hungary’ } 
Covaxin, Oxford/AstraZeneca:>>{ ' India'} 

Pfizer/BioNTech, Sinopharm/Beijing:>>{'Peru', 'Macao', 'Jordan’} 

Sinopharm/Beijing, Sputnik V:>>{' Montenegro’, 'Laos’'} 

Oxford/AstraZeneca, Pfizer/BioNTech, Sinovac, Sputnik :لا‎ <<4 'Mexico'} 

EpiVacCorona, Sputnik ۷۵ 

Pfizer/BioNTech, Sputnik V:>>{' San Marino'} 

Johnson&Johnson: <<) ' South Africa'} 

Pfizer/BioNTech, Sinovac, Sputnik V:>>{'Tunisia'} 

Oxford/AstraZeneca, Pfizer/BioNTech, Sinopharm/Beijing, Sinopharm/Wuhan, Sputnik :لا‎ <<) 'United Arab 
Emirates'} 

Johnson&Johnson, Moderna, Pfizer/BioNTech:>>{ 'United States'} 


الآن دعنا نتخيل هذه البيانات لإلقاء نظرة على مجموعة اللقاحات التى يستخدمها کل بلد: 


2۶ و 201۵98 .۰ 0101۷ 1۳001 
۷ وه 0101۷7۰0۴۴۶116 1۳0011۲ 
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یت فد = هه هلان موه عدم > ها 9۵ 
color = 'vaccines')‏ 

,300<اطو 61ظ) 121۷0۱6 Update‏ . مق 172061186 

Ta EGA LE 90 رها ره د اه ر‎ O) 

vaccine_map.show )( 


vaccines 
Oxford/AstraZzeneca 

Pfizer/BioNTech, Sinovac 

Sputnik V 

Pfizer/BioNTech 

Oxford/AstraZzeneca, Sinopharm/Beijir 
Oxford/AstraZzeneca, Pfizer/BioNTech 
Moderna, Oxford/AstraZeneca, Pfizer/ 


Oxford/AstraZeneca, Pfizer/BioNTech, 
Oxford/AstraZzeneca, Sinovac 

Oxford/AstraZzeneca, Sinopharm/Beijir 
Sinopharm/Beijing, Sinopharm/Wuhar 
Oxford/AstraZzeneca, Sinopharm/Beijir 
Oxford/AstraZeneca, Pfizer/BioNTech, 


Sinonharm/Beiiina 


الملخص 

إذن هذه هي الطريقة التي یمکننا بها تحليل نوع اللقاحات التي يأخذها كل بلد اليوم. يمكنك 
استكشاف المزيد من الأفكار من مجموعة البيانات هذه حيث يوجد الكثير الذي يمكنك القيام 
به باستخدام هذه البيانات. آمل أن تكون قد أحببت هذا المقال حول تحليل لقاحات -605710© 
9 باستخدام بايثون. 


3 التنبق بمبيعات ألعاب الفيديو باستخدام لغة بایئون 
Video Game Sales Prediction with Python‏ 


تحليل مبيعات ألعاب الفيديو (202172515 52165 مصةع 171060) هو بيان مشكلة شائع على 
عاععة]. يمكنك العمل على هذه المشكلة لتحليل مبيعات أكثر من 16500 لعبة أو يمكنك 
أيضًا تدريب نموذج التعلم الآلي للتنبؤ بمبيعات ألعاب الفيديو. لذلك إذا كنت تريد معرفة كيفية 
تدريب نموذج تنبؤ بمبيعات آلعاب الفیدیی فهذه المقالة مناسبة لك.في هذه المقالة. سأوجهك 
خلال مهمة تعلم الالة حول تدريب نموذج توقع مبيعات لعبة فيديو باستخدام بايثون. 


نموذج التنبة بمبيعات ألعاب الفيديو باستخدام بايثون 

تحليل بيانات المبيعات لأكثر من 16500 لعبة هو بیان مشكلة شائع جدا على 16۵8016 يمكنك 
إما حل هذه المشكلة للعثور على العديد من الأنماط (patterns)‏ والعلاقات (relationships)‏ 
بين العوامل التي تؤثر على مبيعات آلعاب الفيديو. أو يمكنك استخدام مجموعة البيانات هذه 
للتنبؤ بمبيعات ألعاب الفيديوفي المستقبل. لذلكفي القسم آدناه. سأوجهك خلال كيفية تدريب 
نموذج التعلم الآلي للتنبؤ بمبيعات ألعاب الفيديو باستخدام بايثون. 


تحتوي مجموعة البيانات التي أستخدمها لهذه المهمة على قائمة بألعاب الفيديو ومبيعاتها. لنبدأ 
هذه المهمة عن طريق استيراد مكتبات بايثون ومجموعة البيانات الضرورية: 

1۳001۲ pandas وه‎ 0 

1115526 MUNDY aS MP 


1۳001 1۵101011110 ۰0۷۵10 وه‎ 1 
import seaborn as 585 


462523 < PA Ee CSM ) یرو‎ ESM) 
PDELRE (data head )( ( 


Rank Name Platform Year ... EU_Sales JP_Sales Other_Sales Global_Sales 
e 1 Wii Sports Wii 2006.0 ... 29.02 3.77 8.46 82.74 
1 2 Super Mario Bros. NES 1985.6 ... 3.58 6.81 0.77 40.24 
2 3 Mario Kart Wii Wii 2008.0 ... 12.88 3.79 3.31 35.82 
3 4 Wii Sports Resort Wii 2009.0 ... 11.01 3.28 2.96 33.00 
4 5 Pokemon Red/Pokemon Blue 68 1996.0 ... 8.89 10.22 1.00 31-37 


دعنا الآن نرى ما إذا كانت مجموعة البيانات هذه تحتوي على قيم خالية: 


(SAE . 15۳1011 )( SUMO)‏ عاك طم 


علم البیانات: عن طريق الامئلة 191 


Rank 8 
Name 8 
Platform 8 
Year 271 
Genre 8 
Publisher 58 
NA_Sales 
EU_Sales 
JP_Sales 
Other_Sales 
600531-25 
dtype: 64 


© © © © ه 


سأقوم الآن بإنشاء مجموعة بيانات جديدة تزيل القيم الخالية: 


data = data.dropna() 
قبل تدريب النموذج» دعنا نلقي نظرة على أفضل 10 فئات من الألعاب مبيعًا:‎ 


1 وه 1۵10۵10611 11۳000۳1۲ 

qame = 0218 . رتت 22ت ) «طصیتاهو‎ ] ۲610۳821 Sales | 820ظ. () اصتاهع‎ )10( 
CUSIEOM و6۵10‎ = MPL. و6۵1‎ NoMa la ze (amin >Min )2۳6( , 

vmax=max (game) ) 

CON oU SS > MOL. CM. رمات لات )شاط‎ COLE SRE) ( FOE [عصوو شد لك‎ 


((77) <ه2 051 ۶1) هیال ۴1 . 111 

11 ۰۳16 (game, 12061 9292۳6 . 1506۶, colors=colours) 
۵1 ات 1ك عدشت‎ > ME Ci cle را‎ O9, توت‎ EY) 
قلط‎ = CIEE )ا‎ 

رك للك 2 ا للد لدت ع ) عت شع 2 2 1E CE J ACO‏ 

ECR LEONE, 51295-12(‏ .طلم 

plt.title ("Top 10 Categories of Games Sold", fontsize=20) 
1011 . 5101 )( 


Top 10 Categories of Games 0 
Adventure 


Fighting Action 


Misc 


Simulation 
Platform 


Puzzle Shooter 


Reding Role-Playing 


دعنا الآن نلقى نظرة على الارتباط (2011612607) بين ميزات مجموعة البيانات هذه: 


DERE (Gal a CORE )( 
889 192 10382 (dala: 601۳ )( , ۳۵02۲۸1۲61 E) 
1911 . 510170 


192 التنبق بمبيعات ألعاب الفيديو باستخدام لغة بايثون 


Rank 
Year 
NA_Sales 
EU_Sales 
رP_Sales‎ 


Other_Sales 


Global_Sales 


0 ۳ 0 
0 5 1 1 9 
8 ۲ 6 6 8 


tank 
Year 


نموذج التنبؤ بمبيعات ألعاب الفيديو التدريبية 
دعنا الآن نری كيفية تدريب نموذج التعلم الالي للتنبؤ بمبيعات ألعاب الفيديو باستخدام بايثون . 
سأقوم باعداد البيانات عن طريق تخزين الميزات التي نحتاجها لتدريب هذا النموذجفي المتغير 
×وتخزين العمود الهدففي المتغيرلا : 

x = 0212 ] ["Rank", "NA Sales", "EU Sales", "JP Sales", 


0۳9 Sale Sl 
۷ > 1وطه1تی 1 تاع1‎ 91691 


الآن دعنا نقسم البیانات ونستخدم خوارزمية الانحدار الخطی (1681©55101 11۳627) لتدریب 
SOE‏ اوه 1۵10 جاع من كد صن لات لله الع 10 161681۳70 ۴1۲010 


SOIC, ۷۶‏ عت EAN‏ = اوه۷۲ ,۷۵18 6 27ت كر 
les 52125-02729020 55325-5-42(‏ 


From 5161681۳70 . linear model 1و 2012 وم دی دصرد‎ ON 
model = LinearRegression )( 

( ۷121 ,لت ع ع ) ۴1 1۱۵061 

predictions = 0061 . تاه 1۵01و‎ (xtest) 


الملخص 

هذه هي الطريقة التي یمکننا بها تدریب نموذج التعلم الالي للتنبؤ بمبیعات آلعاب الفیدیو. هذا 
بیان مشهور لمشكلة 16282216 یمکنك استخدامه لتحسین مهاراتك‌في العمل مع البیانات 
والتدريب على نموذج التعلم الالي. آمل أن تکون قد أحببت هذه المقالة حول كيفية تدریب 
نموذج التنبؤ بمبيعات آلعاب الفيديو باستخدام بايثون. 


تحلیل رحلات 17067 باستخدام بایئون 193 


Uber 11:0۶ تحلیل رحلات 17067 باستخدام بایئون‎ 4 
Analysis using Python 


كانت 17561 مصدرا رئیسیّا للسفر للأشخاص الذين يعيشونفي المناطق الحضرية. بعض الناس 
لا يملكون سياراتهم بينما البعض الآخر لا يقود سياراتهم عمدا بسبب جدولهم المزدحم. لذلك 
تستخدم أنواع مختلفة من الناس خدمات 1061 وخدمات سيارات الأجرة الأخرى.في هذه 
المقالةه سوف آخذك إلى تحليل رحلات 17067 باستخدام بايثون. 


تحليل رحلات 10561 

من خلال تحليل رحلات ۰17007 يمكننا رسم العديد من الأنماط مثل أي يوم يحتوي على أعلى 
وأقل عدد أو أكثر الساعات ازدحامًا ل اطا والعديد من الأنماط الأخرى. تستند مجموعة 
البيانات التي أستخدمها هنا إلى رحلات 17067 من نيويورك وهي مدينة بها نظام نقل معقد 
بیع وى سني كين 


تحتوي مجموعة البيانات على بيانات لحوالي 4.5 مليون بيك آب‌في مدينة نيويورك من أبريل إلى 
سبتمبر و 14.3 مليون بيك أب من يناير إلى يونيو 2015. يمكنك فعل الكثير باستخدام مجموعة 
البيانات هذه بدلاً من مجرد تحليلها. لكنني الوقت الحاليءفي القسم أدناه. سوف آخذك إلى 
تحليل رحلات 5617[] باستخدام بايثون. 


تحليل رحلات 17067 باستخدام بايثون 
سأبدأ مهمة تحليل رحلات 17067 عن طريق استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


1۳0011۲ Pandas 25 0 

1 وه ۰0۷۵101 1۵10101110 1۳001 

import seaborn as 5 

ردقه و هلوت ) ترفك O. ESE‏ = ععاواه) 

data ["Date/Time"] = data["Date/Time"] .map )50 . (©172ع0386_هغ‎ 
data. head )( 


Date/Time Lat Lon Base 
6 2014-09-01 00:01:00 40.2201 -74.0021 2 
1 2014-09-01 00:01:00 40.7500 -74.0027 2 
2 2014-09-01 00:03:00 40.7559 -73.9864 2 
3 2014-09-01 00:06:00 40.7450 -73.9889 2 
4 2014-09-01 00:11:00 40.8145 -73.9444 2 


تحتوي هذه البيانات على بيانات حول التاريخ والوقت وخط العرض وخط الطول وعمود أساسي 
يحتوي على رمز تابع ل م0111 ٥۲‏ طنا. يمكنك الحصول على المزيد من مجموعات البيانات 


194 علم البيانات: عن طريق الامثلة 


لمهمة تحلیل رحلات 175661 من هنا »في الوقت الحالی. دعنا نجهز البیانات التي أستخدمها هنا 
لتحلیل رحلات ۲٥ط‏ وفقا للأيام والساعات: 


0312 ] ۲۲۵۷/۲ [ = data["Date/Time"] .apply (lambda x: x.day) 
data ["Weekday"] = data["Date/Time"] .apply (lambda x: 
x.weekday () ) 

data["Hour"] = data ["Date/Time"] . 20017 (lambda x: x.hour) 
10131 6 )0262 . 1620 )( ( 


Date/Time Lat Lon Base Day Weekday Hour 
6 2014-09-01 00:01:00 40.2201 -74.0021 2 1 86 60 
1 2014-09-01 00:01:00 40.7500 -74.0027 2 
2 2014-09-01 00:03:00 40.7559 -73.9864 2 
3 2014-09-01 00:06:00 40.7450 -73.9889 2 
4 2014-09-01 00:11:00 40.8145 -73 .9444 2 


6 
6 


1 
اد 
1 
6 1 
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لذلك أعددت هذه البيانات وفقا للأيام والساعات حيث إنني أستخدم رحلات 067[ لشهر 
سبتمير» لذلك دعونا نلقي نظرة على كل يوم لمعرفة اليوم الذي كانت فيه رحلات 1067 هي 
الأعلى: 


LAT)‏ 1268112310 ركذتت ماع 5 | OE (EGE‏ هاوه 
( دس 1لت 22 ) 11510101 . 525 


0 
| 


000 
0 5 10 15 2 25 30 
Day 


من خلال النظر إلى الرحلات اليومية» یمکننا القول إن رحلات 17062 ترتفعني يام العمل 
وتنخفض في عطلات نهاية الأسبوع. الآن دعنا نحلل رحلات 175615 وفقا للساعات: 


SRS 11510101 )0212 HOME LID 


Density 


۱ ||| 


۷۳ 
۱۸ U 


) ۰ 


1 


1 
Hour 


وفقا لبيانات كل ساعةء تقل رحلات +1756 بعد منتصف الليل ثم تبدأني الزيادة بعد الساعة 5 
صباحًا وتستمر الرحلاتني الارتفاع حتى الساعة 6 مساءً بحيث تكون الساعة 6 مساءً هي أكثر 
الساعات ازدحامًا ل مطل ثم تبدأ الرحلاتني التناقص. الآن دعنا نحلل رحلات 17662 وفقا 
لأيام الأسبوع: 


91 . 41510101 (data ["Weekday™"] ) 


3 
Weekday 


في الشكل 0 أعلاه يشير إلى يوم الأحد. وفي أيام الأحد. تكون رحلات 17067 وأكثر من أيام 

السبت. لذا يمكننا القول إن الأشخاص يستخدمون 175661 أيضًا للتنزه بدلاً من الذهاب إلى العمل 

فقط.ني أيام السبت. تكون رحلات 1761 هي الأدنى وفي يوم الاثنين هي الأعلى. دعنا الآن نلقي 
نظرة على الارتباط (00116136101) بين الساعات وأيام الأسبوعفي رحلات :U ber‏ 

# Correlation of Weekday and Hour 

df = data.groupby (["Weekday", "Hour"] ) .apply (lambda x: len (x) ( 


0۴ < dE 025522321 )( 
sns.heatmap (df, annot=False) 


196 علم البيانات: عن طريق الامثلة 
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نظرًا لأننا نمتلك بيانات حول خطوط الطول والعرض. فيمكننا أيضًا رسم كثافة رحلات طا 
وفقًا لمناطق مدينتك الجديدة: 


data.plot (kind='scatter', x='Lon', y='Lat', alpha=0.4, 
s=data['Day'], label='Uber 5م121‎ ' , 

EGS ماج‎ OO 21598 - ا لام‎ CMSB CS) 

222515 12225 6562" ) 214 دع 111 

1 ۰1606۳00 )( 

1011 . 5۳017 )( 


Uber Trips Analysis 


Uber Trips 


الملخص 
هذه هي الطريقة التي يمكننا بها تحليل رحلات 10161 لمدينة نيويورك. بعض الاستنتاجات التي 
حصلت عليها من هذا التحليل هي: 

2 في أيام السبت. يستخدم عدد أقل من الأشخاص 167 . 


3 6 مساءً هو أكثر الأيام ازدحامًا بالنسبة ل ععحالا. 


تحليل رحلات e۲‏ طا باستخدام بایئون 
4. في المتوسط تبدأ زيادة رحلات 07 آفي حوالي الساعة 5 صباحا. 


5. تبداً معظم رحلات ۲٥ط‏ بالقرب من منطقة مانهاتنفي نيويورك. 


آمل أن تكون قد أحببت هذه المقالة حول تحليل رحلات 1767 باستخدام بايثون. 


127 


تحلیل بحث 600816 باستخدام بایئون 198 


06200216 تحلیل بحث 600816 باستخدام بایئون‎ 5 
Search Analysis with Python 


يتم إجراء ما يقرب من 3.5 مليار عملية بحث على 00:۵) يوميًاء مما يعني أنه يتم إجراء ما 
يقرب من 40.000 عملية بحث كل ثانية على عا ع000. لذا يعد بحث 7008[16) حالة استخدام 
رائعة لتحليل البيانات بناءً على استعلامات البحث. مع وضع ذلكفي الاعتبار,ني هذه المقالة: 


سوف أطلعك على مهمة تحليل بحث 00۵16 باستخدام بايثون. 


تحليل بحث 000۵16 باستخدام بايثون 
لا تمنح 008[6) الكثير من الوصول إلى البيانات المتعلقة بطلبات البحث اليومية» ولكن يمكن 
استخدام تطبيق آخر من مومه یعرف باسم و194 000۵16 لمهمة تحليل بحث 
6 توفر 1۳6005 000216 واجهة برمجة تطبيقات ]۸۳ يمكن استخدامها لتحليل 
عمليات البحث اليومية على عاع600. تغرف واجهة برمجة التطبيقات هذه باسم 07706005 
ويمكنك تثبيتها بسهولةني أنظمتك باستخدام الأمر مذم؛ 
a ۳۷5‏ 810 
آتمنی أن تکون قد قمت الآن بتشیت مکتبة 60وی آنظمتك بسهولة فلنبداً الآن بمهمة 
تحلیل بحث 00216 عن طریق استیراد مکتبات بایثون الضرورية: 
0 وه import Pandas‏ 
from pytrends.request import TrendReq‏ 


1 10۳0 عاط0‎ Mae OLO ELT وه م۵1‎ PLE 
trends = TrendReq )( 


سأقوم هنا بتحليل مؤشرات بحث ءآعمه6 على الاستعلامات القائمة على جملة البحث 
Machine Learning"‏ '. لذا فلتقم بإنشاء إطار بيانات لاهم 0 بلدان تبحث عن " Machine‏ 
"Learning‏ على Google‏ : 


Henas. ۱110 02171020 (kw Tist=| Machine 1691019 ۲[( 
data = 5292405 2225252586 6910 )( 

da Ea < 0218 . 507 7211069 (Ov Mae Mi ne 6 
ascending=False) 

data = data.head (10) 

911 1 )0212( 
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geoName 

China 166 
Singapore 36 
St. Helena 28 
India 25 
Hong Kong 21 
South Korea 19 
Nepal 18 
Pakistan 16 
Israel 14 
Ireland 14 


لذلك. وفقا للنتائج المذكورة أعلا تتم معظم طلبات البحث المستندة إلى " Machine‏ 
Learning‏ "في الصين. یمکننا أيضًا رسم هذه البيانات باستخدام مخطط شريطي :(bar chart)‏ 


0210 . 6561 31806 )( . 101 X= 51190017 v> Machine م61‎ 
۶1091 <م2‎ (20,15), 161۳002۷ 021-۳( 

۱11 ۰51-۷16 . 1:96 ('fivethirtyeight') 

11 . 7 


0 
لوو عو كرما موا كج ۱ ررد 
geoName :‏ : 1 3 


نظرًا لأننا نعلم جميعًا أن "Machine Learning"‏ كان محط اهتمام العديد من الشركات 
والطلاب على مدار السنوات الثلاث أو الأربع الماضيةء فلنلق نظرة على اتجاه عمليات البحث 
لمعرفة كيف زاد إجمالى استعلامات البحث المستندة إلى "عصتصجع 1 عصتطء212 " أو انخفض 
على عاع000: 


data = TrendReq (hl='en-US', tzZ=360) 

0262 . 1110 ۳271020 )167 13 << ] Maenine 162710100 ۲[( 
data > data ا1۳167169‎ Over 1۳6 )( 

ET, كعك‎ < 01 SUOSESESKE OSM Ze = )20, 15( ( 
04212 ] 'Machine Learning'].plot () 

.Style. Use ) "217211111211721 ( 

.title ) ۲1۵2۵1 Google Searches for Machine 1۵211۴100۲ , 
tweight='bold') 

.xlabel ('Year') 

۰۷1۵1061 ) ۲۲۵1۵1 621 ( 

. 51101 )( 


م 
0 
بن ET OT E E‏ سيو 
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Total Google Searches for Machine Learning 


الملخص 

لذلك يمكننا أن نرى أن عمليات البحث القائمة على "Machine Learning"‏ على Google‏ 
بدأتفي الزيادةفي عام 2017 وتم إجراء أعلى عمليات البحث‌ي عام 2020 حتى اليوم. هذه هي 
الطريقة التي يمكننا بها تحليل عمليات بحث 000816 بناءً على أي كلمة رئيسية. يمكن لأي 
نشاط تجاري إجراء تحليل بحث 700816 لفهم ما يبحث عنه الأشخاص على عاع 000 في أي 
وقت. أتمنى أن تكون هذه المقالة قد أحببت تحليل بحث 600816 باستخدام بايثون. 
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Financial Budget تحليل الموازنة المالية مع بايئثون‎ )6 
Analysis with Python 


لكل دولة موازنة مالية (اععداط [020»2) تصف قدرة الإنفاق الحكوميةفي مختلف قطاعات 
الاقتصاد. في هذه المقالة سوف أطلعك على مهمة تحليل الموازنة المالية باستخدام بايثون. 


ما هى الموازنة المالية؟ 

بوجد الوم العدید من محللي البیانات ال یأتون من خلفية غیر برمجية. ٍذا کنت من خلفية 
تجارية. فقد تعرف ما هي الميزانية المالية. باختصار إنه تقرير مفصل عن دخل ونفقات الحکومة 
عن سنة مالية. 


قد تحصل على مهمة تحليل الموازنة المالية لبلد ما كل عام إذا كنت تعمل كمحلل بياناتفي 
مجال الإعلام والاتصالات» حيث يتعين على وسائل الإعلام شرح أولويات الحكومة للسنة 
المالية الكاملة.في القسم آدناه. سوف آخذك من خلال برنامج تعليمي حول كيفية أداء مهمة تحليل 
الموازنة المالية باستخدام بايثون. 


تحليل الموازنة المالية مع بايثون 
أتمنى أن تكون قد فهمت الآن ما هي الموازنة المالية ومتى قد تحتاج إلى تحليلها كمحلل بيانات. 
دعونا نری كيف يمكننا أداء مهمة تحليل الموازنة المالية باستخدام بايثون. سأبدأ هذه المهمة عن 
طريق استيراد مكتبات بايثون الضرورية ومجموعة بيانات تحتوي على بيانات حول الموازنة 

المالية للهند لعام 2021. 

2115526 MUNDY aS MD 
11۳001 Gandas وه‎ 0 
1۳001 1۵101011110 ۰0۷۵101۲ وه‎ 1 


الاسم 2021 096 ۲۲۳۴012 ) 697 0.1620 > 02162 
() 1620 . 0312 


Department /Ministry Fund allotted(in (ودعمممء*‎ 


86 MINISTRY OF AGRICUL TURE 1315319 
1 DEPARTMENT OF ATOMIC ENERGY 18264.89 
2 MINISTRY OF AYURVEDA, YOGA 2970.30 
3 MINISTRY OF CHEMICALS AND FERTILISER 80714.94 
4 MINISTRY OF CIVIL AVIATION 3224.67 


دعونا نلقي نظرة على جميع الأقسام التي تغطيها هذه الموازنة: 


911 1 (OEE) 
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Department /Ministry Fund allotted(in (5ع۳0۳۴ع5‎ 


6 MINISTRY OF AGRICULTURE 131531 9 
1 DEPARTMENT OF ATOMIC ENERGY 18264.89 
2 MINISTRY OF AYURVEDA, YOGA 2970.30 
3 MINISTRY OF CHEMICALS AND FERTILISER 80714.94 
4 MINISTRY OF CIVIL AVIATION 3224.67 
5 MINISTRY OF COAL 534.88 
6 MINISTRY OF COMMERCE AND INDUSTRY 12768.25 
7 MINISTRY OF COMMUNICATION 75265.22 
8 MINISTRY OF CONSUMER AFFAIRS 256948 . 40 
9 MINISTRY OF CORPORATE AFFAIRS I213 
18 MINISTRY OF CULTURE 2687.99 
11 MINISTRY OF DEFENCE 478195 . 2 
12 MINISTRY OF DEVELOPMENT OF NORTH EASTERN REGION 2658.00 
13 MINISTRY OF EARTH SCIENCES 1897.13 
14 MINISTRY OF EDUCATION 93224.31 
15 MINISTRY OF ELECTRONICS AND INFORMATION TECHNO. . . 9720.66 
16 MINISTRY OF ENVIRONMENT, FOREST 2869.93 
17 MINISTRY OF EXTERNAL AFFAIRS 18154.73 
18 MINISTRY OF FINANCE 1386273.30 
19 MINISTRY OF FISHERIES, ANIMAL HUSBANDRY 4322.82 
20 MINISTRY OF FOOD PROCESSING INDUSTRIES 1308.66 
21 MINISTRY OF HEALTH AND FAMILY WELFARE E E f 
22 MINISTRY OF HEAVY INDUSTRIES 1017.08 
23 MINISTRY OF HOME AFFAIRS 166546.94 
24 MINISTRY OF HOUSING AND URBAN AFFAIRS 54581.00 
25 MINISTRY OF INFORMATION AND BROADCASTING 4071.23 
26 MINISTRY OF JAL SHAKTI 69053.02 
27 MINISTRY OF LABOUR AND EMPLOYMENT 13306.50 
28 MINISTRY OF LAW AND JUSTICE 3229.94 
29 MINISTRY OF MICRO, SMALL AND MEDIUM ENTERPRISES 15699.65 
30 MINISTRY OF MINES 1466.82 
31 MINISTRY OF MINORITY AFFAIR 4810.77 
32 MINISTRY OF NEW AND RENEWABLE ENERGY 5753.00 
33 MINISTRY OF PANCHAYATI RAJ 913.43 
34 MINISTRY OF PARLIAMENTARY AFFAIRS 65.07 
35 MINISTRY OF PERSONNEL, PUBLIC 5 2097.24 
36 MINISTRY OF PETROLEUM AND NATURAL GAS 15943.78 
37 MINISTRY OF PLANNING 1062.77 
38 MINISTRY OF PORTS, SHIPPING 1702.35 
39 MINISTRY OF POWER 15322.00 
40 THE PRESIDENT, PARLIAMENT, UNION PUBLIC SERVIC... 1687.57 
41 MINISTRY OF RAILWAYS 110054. 4 
42 MINISTRY OF ROAD TRANSPORT AND HIGHWAY 1181610 
43 MINISTRY OF RURAL DEVELOPMENT 133689. 0 
44 MINISTRY OF SCIENCE AND TECHNOLOGY 14794.03 
45 MINISTRY OF SKILL DEVELOPMENT 2785.3 
46 MINISTRY OF SOCIAL JUSTICE AND ۲ 11689.39 
47 DEPARMENT OF SPACE 13949.09 
48 MINISTRY OF STATISTICS 1409.13 
49 MINISTRY OF STEEL 192 
50 MINISTRY OF TEXTILES 3631.64 
51 MINISTRY OF TOURISM 2026.77 
52 MINISTRY OF TRIBAL AFFAIRS 7524.87 
53 MINISTRY OF WOMEN AND CHILD DEVELOPMENT 24435.00 
54 MINISTRY OF YOUTH AFFAIRS AND SPORTS 2596.14 
55 NaN NaN 


56 GRAND TOTAL 3483235.63 
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يمكنني رؤية القيم المفقودة NaN)‏ )في مجموعة البيانات هذه دعنا نزيل قيم NaN‏ ونتابع 
مهمة تحليل الميزانية المالية باستخدام بايثون: 

1100820 . 01212 
أستطيع أن آری أنه ليست کل الأقسام التي تغطیها مجموعة البیانات هذه هي الا قسام الرئيسيق 
حيث یمکن تغطية بعض الاقسامي فتة آخری. لذلك دعونا نجهز البیانات عن طریق اختیار 
الاقسام الرئيسية فقط ووضع جمیع الاقسام الأخرىفي الفئة الاخری: 


Department /Ministry Fund allotted(in (وءمممء*‎ 


6 MINISTRY OF AGRICULTURE 131531.19 
1 MINISTRY OF CONSUMER AFFAIRS 256948.40 
2 MINISTRY OF DEFENCE 478195 .2 
3 MINISTRY OF EDUCATION 93224.31 
4 MINISTRY OF FINANCE 1386273.30 
5 MINISTRY OF HOME AFFAIRS 166546.94 
6 MINISTRY OF RAILWAYS 110054 64 
7 MINISTRY OF ROAD TRANSPORT AND HIGHWAY 1181010 
8 MINISTRY OF RURAL DEVELOPMENT 133689 . 6 
9 OTHERS 592971.08 


دعنا الآن نرسم هذه البيانات لإلقاء نظرة على أولويات الحكومة للسنة المالية: 


data.plot.bar (x=' Department /Ministry', y='Fund allotted(in 
6:20 ۲۱ 


Fund allotted(in crores)‏ هر 


OTHERS 


MINISTRY OF AGRICULTURE 
MINISTRY OF CONSUMER AFFAIRS 
MINISTRY OF DEFENCE 

MINISTRY OF EDUCATION 

MINISTRY OF FINANCE 

MINISTRY OF HOME AFFAIRS 
MINISTRY OF RAILWAYS 

MINISTRY OF RURAL DEVELOPMENT 


MINISTRY OF ROAD TRANSPORT AND HIGHWAY 


Department /Ministry 
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يمكننا أن نرى أن قسم المالية (2752626م0 852266) تحصل على أكبر حصة من الميزانية 
الإجمالية للحكومة. دعنا الآن نرسم هذه البياناتفي مخطط دونات 0100 040116) للحصول 
على رؤية واضحة لتوزيع الأموال بين جميع الأقسام: 


dE - 0212 ] ۲۳8۵0 21100160 ظ18)‎ CEOECeS) | 

labels = data ["Department /Ministry"] 

1911 . ۴1 هیال‎ (figsize=(7,7)) 

plt.pie (df, labels=labels, autopct='%$1.1f%%', 5211210016290, 
pctdistance=0.85, shadow =True) 

CEME EAN كت 1ت تتشت‎ > le Ci ecele ( (O, OJ, U.S, Colo A EY) 
قلط‎ - E e £ )ا‎ 

1E 0۵9 O sO 9۳ تاه‎ (OEE ره للد‎ 

1911 . EEN LEONEL, Sze 12) 

The 50961۲, ۴0۳8151 26<20(‏ 612 طه دابا تاو ۲1ظ۲) 651216 11 

1011 . 5۳017 )( 


Distribution of The Budget 


MINISTRY OF AGRICULTURE 
MINISTRY OF CONSUMER AFFAIRS 


MINISTRY OF DEFENCE 
MINISTRY OF RURAL DEVELOPMENT 


MINISTRY OF ROAD TRANSPORT AND HIGHWAY 


MINISTRY OF EDUCATION MINISTRY OF RAILWAYS 


MINISTRY OF HOME AFFAIRS 


MINISTRY OF FINANCE 


الملخص 

يمكننا أن نرى أن قسم المالية تحصل على 40/ من الأموال. هذه هي الطريقة التي یمکننا بها 
تحليل مجموعة البيانات التي تحتوي على بيانات حول إيرادات ونفقات الحكومة لسنة مالية. 
آمل أن تكون قد أحببت هذا المقال حول تحليل الميزانية المالية باستخدام بايثون. 


یل افضل خدمات یت تخاب 


7 تحلیل أفضل خدمات البث باستخدام بایئون ۲6:6 
Streaming Service Analysis with Python‏ 


هناك الكثير من المنافسة بين جميع خدمات البث الرئيسية مثل Netflix‏ و Prime Video‏ و 
Huu‏ و +عصوز(1. بصفتك عالم بیانات. قد تكون مهمة رائعة جدا بالنسبة لك أن تجد أفضل 
خدمة بث (عع56171 ع سندطدع5) من بينها.في هذه المقال سأقدم لك مشروع علم البيانات 
حول أفضل تحليل لخدمة البث باستخدام بايثون. 


تحليل أفضل خدمات البث 
لتحليل أفضل خدمة بث. سأستخدم تقييمات العروض على جميع المنصات الرئيسية مثل 
Netflix‏ و Prime Video‏ و Hulu‏ و .Disney+‏ 
تحتوي مجموعة البيانات التى سأستخدمها لمهمة تحليل أفضل خدمة بث على قائمة شاملة 
بجميع العروض التلفزيونية المتوفرة على الأنظمة الأساسية الأربعة التي نقوم بمقارنتهاني هذه 
المهمة. 
آنا أستخدم مجموعة البيانات هذه للعثور على أفضل خدمة بث ولكن كمبتدئ » يمكنك أيضًا 
استخدام مجموعة البيانات هذه لمهام مثل: 

1 تحليل منصات البث. 

2. تحليل تصنيفات 11/1310 و Rotten Tomatoes‏ لجميع العروض. 

3. تحلیل الفئة العمرية المستهدفة لمعظم المسلسلات التليفزيونية.. 


تحليل أفضل خدمات البث باستخدام بايثون 
لنبدأ الآن بمهمة تحليل أفضل خدمة بث باستخدام بايثون. سأبدأ هذه المهمة عن طريق استيراد 
جميع المكتبات ومجموعة البيانات الضرورية: 


import numpy as np # linear algebra 
import pandas as pd # data processing 


1 1۳001] ۷ 

110001 1001۷ ۰. و و201۵‎ 35 Bx 

E FOM 101171 . عهصوصد واه 1مطناو‎ Make  وانطم‎ 10 
import 563201213 as 5 

1 وه ۰0۷۵101 1۵101011110 1۳001 


Eu 5۳005 ۱0۰ 56۵۵0 9 ۲۱۲ 5۳09. اكه‎ 
EY 5۳0175 . 1620 )( 
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O tv_shows = pd.read_csv( 'tv_shows.csV') 
tv_shows.head( ) 


Unnamed: @ Title Year Age IMDb Rotten Tomatoes Netflix Hulu Prime Video Disney+ type 
0 0 Breaking Bad 2008 18+ 9.5 96% 1 0 0 0 1 
1 1 Stranger Things 2016 16+ 8.8 93% 1 0 0 0 1 
2 2 Money Heist 2017 18+ 8.4 91% 1 0 0 0 1 
3 3 Sherlock 2010 16+ 9.1 78% 1 0 0 0 1 
4 4 Better Call Saul 2015 18+ 8.7 97% 1 0 0 0 1 


نظرًا لأننا نحلل البيانات فقط. فلن نحتاج إلى استخدام خوارزميات التعلم الآلي هنا. يمكن إنجاز 
معظم العمل من خلال رسم وتحليل تقييمات العروض على منصات البث. 


تحضير البيانات 
دعنا نجهز مجموعة البيانات حتى نتمكن من تحليل البيانات بسهولة. سأبدآنی إعداد البيانات 
بإسقاط القيم المكررة بناء على عنوان العروض (550555 :)title of the‏ 


وا (SUBSE‏ 221295 12 لام نك قرم شك ومد ما 
keep='first', inplace=True)‏ 


الآنءفي قسم الكود أدناه. سأقوم بملء القيم المفقودةني البيانات بالأصفار ثم تحويلها إلى أنواع 
بيانات عدد صحيح: 


Eu SHOWS ۲5۵۲1۲6۳8 Moma 060265 ll > EV 5۳0075 ] ۲5۵۲۵ 
۲۵۳8۵۲065۲1 ۰.۴1112 )۲05۲( 

SHOWS ] ۲5۵11۲6۳8 ۲0۳۵ ]0695 ۲ [ = Ev 5۳0075 ] ۲5۵۲۲6‏ ا 
((۲5۲) 10 اوط Tomatoes. [ ۰. 20017 ) 2220602 x : XS‏ 

Ev Shows] ۲5۵۲6۲ ۲01۳8۵1069 ۲[ = Pd. tO 22026212 (EV 9075 ] ۲5۹۵۲۲ 


1 


Tomatoes" [( 


Ev _ 0۲75و‎ ] ۲ ۲1۲0۲ SE Shows ۲ ۲1410 ۲ [ . ۶11106 )0( 
Ev 50175 ] IMDS =< تا‎ Shows] ۲ ۲۱۵۲۵ ۲ 0 
EW SAMOS ۲ 11۲0۲ = E 05و‎ ] ۲ 1141۲0 ۲ [ . 2911706 ) ۲1۳۴۲۲( 


سیکون رسم البیانات آمرا سهلاً إذا حصلنا على 1 و 0 ثانيةني الأعمدة المسماة 713:6 و 
Hulu‏ و Disney‏ و Prime Video‏ بتسیق فتوي (62002011621). قد یکون هناك احتمال أن 
یکون العرض نفسه متاحاني آکثر من منصة واحدة: 


HULU, DiSm‏ اه RE Gey Shows EEE‏ کال وان دوس Shows‏ سر 
6 


"Prime 
WEES [| امن رز‎ ESS NIELS ما‎ 
var_name='StreamingOn', 
value mame ۲ Ere 5601 ) 
Eu كسمه‎ TORS < EY SHOWS LONGI EY 910079 10۳89 ] Eee | حح‎ 1[ 
Ev SROWS LONI . م0‎ KES UMASS EreSenl ۲ [ , 101 لك ممت‎ UE) 


سأقوم الآن بدمج هذه البيانات مع البيانات التي بدأنا بها ولكني سأقوم بإسقاط بعض الأعمدة 
غير المرغوب فيها: 
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lv shows eomoined = tv Shows 10۳90 1122355 (Eu Shows, On. Ele 

how='inner') 

lu Shows COMORES وصصنتاهع)‎ SS Unnamed 0۲, 111 م‎ 
۲۱۳۱2112۲, BEME ۷3060۲, 

"Disneyt', ۲۱۷۵۵ [ , inplace=True) 


الآن دعنا نرسم البیانات التي تکون فیها التقييمات آکثر من 1 لمعرفة كمية العروض التلفزيونية 
المتاحة على كل منصة: 


Ev Shows BoD ۵۲11005 < 

tv_ Shows combined] (tv _ shows combined. IMDb < 0) »ع‎ 

tv shows 60۳101060 ] Rotten KOmMatoesl - 0[ 

iv 9015 _ 6۵100 1160 SEOUSDY )۲ 51۲6۵۵1015901۲ Ele مك‎ 022 )( . 101 63 
0 DAE) 


Disney+ 
Hulu 
Netflix 


9 
7 
2 
> 
0 
3 
& 


StreamingOn 


الخطوة النهائية: العثور على أفضل خدمة بث 
الآن دعنا نرسم البيانات للعثور على أفضل خدمة بث بناءٌ على تقييماتهم. سأستخدم أولاً 
مخططات الكمان (12165© 7101112) لقياس تقييمات المحتوى وحداثة منصة البث: 


figure = [|] 

۶۴1 نان‎ . 22 252 )0 ۰۳7101 12 EY Shows لت‎ ۵۲1008, x < 
۲۹5632101۳0011, ۷ < "فشكا"‎ | 44179525! 928 8215012 (( 

۴1 ا) 12 لت لس 0) 26۳۴0 . نان‎ 7 SHOWS OEM ۵۲1008, د‎ > 
"StreamingOn', ۷ = 'Rotten Tomatoes', color='StreamingOn'")) 
و۶1‎ = make 10۲5وطناه‎ )۲۳0۳۷7 922, COLS=4A, 60و‎ ۷۵:6 SLU) 


: (2) 2106( 1 د OE‏ 
AM 221166 )4( :‏ رز EOE‏ 
ری( لاو رل توعد مراد | "مهاه" AC‏ ها وه عمیوعدع EG ASA‏ 


(1۲<۶800و1عط ,7101۲800 ,6 ۳1اه 2010912) 1210۱۲۲ 1002۲6 . ۶۴1 
() 5107 . 0 ۶1 
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100 5 Netflix 
۲ Netflix 
5 Hulu 
5 5 Hulu 
Il Prime Video 
60 Il Prime Video 
7 Disney+ 
4 I Disney+ 
20 
Netflix Hulu Prime Video Disney+ 
100 
80 
60 
40 
20 
0 
Netflix Hulu Prime Video Disney+ 


الآن دعنا نستخدم مخطط مبعثر (0100 620061:) لمقارنة التقييمات بين IM D8‏ و Rotten‏ 
5 لمقارنة أي منصة بث لدیها أفضل التقييماتفي کل من منصات تصنیف المستخدم: 


02.502] (EU Shows _ ,و9ط1ا۵_طتاظ‎ x< IMD, 
y='Rotten Tomatoes',color='StreamingOn ۲( 


StreamingOn= Netflix 
StreamingOn= Hulu 
StreamingOn=Prime Video 
StreamingOn=Disney+ 


6 80 
۰ 
۰ ِ 
۰ 3 
6 82 
3 
۵ 
0 
0 
۰ 3 
40 4 
۰ 
۰ 
۰ 
۰ ۰ 
۰ 
۰ 20 
۰ ۰ ۰ 
۰ 
۰“ ۰ 
ا 
90 80 70 60 50 40 30 20 


الملخص 
باستخدام مخطط الكمان يمكننا ملاحظة ما يلي: 
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1 تحتوي مقاطع فیدیو Hulu‏ و Netflix‏ و ۸۵20۳ على بيانات مهمة. مع زيادة 
المحتوی. تنخفضص الجودة لجمیع الثلائة. 
2. آصبح 1710605 ۳:6 آکثر كثافةني النصف العلوي عند النظر إلى 11۷11213 ویعمل 
بشکل جيدفي الوضع البارد. 
3. آصبحت +تإع1(150 جديدق وقد حققت أيضًا نجاحا کبيراني هذا المجال. 
باستخدام مخطط التبعثر یمکننا أن نلاحظ أنه من الواضح تمامًا أن Amazon Prime‏ يعمل 
جيداني الربع الرابع. حتی باستخدام المخطط الشريطي. یمکننا ملاحظة أن Pim‏ 3220م 
كانت تحتوي على كمية كبيرة من المحتوی. لذا بالنظر إلى جمیع منصات البث. یمکننا أن نستنتج 
أن Amazon Prime‏ آفضل من حيث الجودة والكمية. 
آمل أن تكون قد أحببت هذه المقالة حول مشروع علم البيانات حول تحليل أفضل خدمة البث 


تحليل معدل المواليد باستخداع و 


Birth Rate تحليل معدل المواليد باستخدام بايثون‎ )8 
Analysis with python 


دعنا نلقى نظرة على البيانات المتاحة مجانًا عن الولاداتفي الولايات المتحدةء والتى تقدمها 
مراكز السيطرة على الأمراض (100©). يمكن العثور على هذه البياناتفي وع .وطا٣1ط‏ . 


1۳001۲ Pandas وه‎ 0 

Mead (‏ تا دول DENE‏ روت .وتا نو ) وت PA Bead‏ > ولا 1۳ نا 
OILERS ۲4۵۷7 | >‏ (مباط inolace‏ ,0) ۰۴111۳80 [۲ ۲0۵۷7 ] 95اط 1 
(191) ۰251-706 ۲۵۷۲1 ] ۲15 1 


year month day gender births 


@ 1969 1 1.0 F 4046 
1 1969 1 1.0 M 4440 
2 1969 1 2.0 F 4454 
3 1969 1 2.0 M 4548 
4 1969 1 3.0 F 4548 
1۳5 decade ll < 10 - Births ۲۷۵۵۲۲ [ 7 10( 


,۵806و ۲ decade ll, COLUMNS‏ حرم10۵ ,۲ ۲1۵118 ) 16طهتا عمس 1 وا 
aggfunc='sum'" (‏ 
DERE )1۳5 ۰5620 )( (‏ 


نری على الفور أن عدد الموالید الذکور یفوق عدد الموالید الإناثفي کل عقد. لرؤية هذا الاتجاه 
بشکل آکثر وضوحا. یمکننا استخدام آدوات الرسم المدمجةفي 22025 لرسم العدد الاجمالي 
للموالید حسب السنة: 


1 وه ۰0۷۵101۲ 1۵101011110 1۳001 

import 563201223 as 5 

95 . 561 )( 

ر ۲ index decade‏ ر كات عدت ) EaOle‏ عدم كلت عدت > decade‏ للع سدم 
columns='gender'", aggfunc='sum'")‏ 

3۲6 066606 لام‎ O 

۱11۰712۳61 ) "1! لوعن‎ Bur ERS ۵1 VEGE) 

1911 . 510170 


1e7 


200 gender 
م سس‎ 
175 M 


Total births per year 


1960 1965 1970 1975 1980 1985 1990 1995 2000 
decade 
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المزيد من استکشاف البيانات 
هناك بعض الميزات المثيرة للاهتمام التي یمکننا سحبها من مجموعة البيانات هذه باستخدام 
أدوات 222025 . يجب أن نبدأ بتنظيف البيانات قلي وإزالة القيم المتطرفة (01611615) التي 
تسببها التواريخ المكتوبة بشكل خاطىئ (02665 0۲060دنص) أو القيم المفقودة ( 121155118 
5 إحدى الطرق السهلة لازالة کل ذلك مرة واحدة هي قص القيم المتطرفت وسنفعل ذلك 
من خلال عملية قص سيجما (عصلم مت -محصصعزه) القوية: 
import numpy as np‏ 
([75 ,50 257 | ۲91۳15 افطع 2 5) ELLE‏ 1مك دعن , وط = وه 0121111 


mu = quartiles|[1] 
910 < 0.4 5 )002۵1111 وه‎ ]2[ - 402252155000 


هذا السطر الأخير هو تقدیر قوي لمتوسط العینق. حیث يأتي 0.74 من النطاق الربعي لتوزیع 
غاوسي. باستخدام هذا. یمکننا استخدام التابع (01161770 لتصفية الصفوف التي تحتوي على 
ولادات خارج هذه القیم: 


CORY 6 OES <‏ < © > تا 2 تا تسه ENS OMEN‏ نها = لها ور 
١ 5 = CSL) 3)‏ تا 


DEEERS ] Cav) وتا طددط‎ ] CAV ۰291-۷706 EDE) 
11۳5 . 10066 = 0.1۲0 021611۳6 )10000 * 11۳5 ۰۷61+ 
00 وطع كر‎ MONEE 


1 ۲15۰012۷, ۶0۳۳0۵12۲ 5۷59460 ۲( 


births ['dayofweek'] = قطغ 1ط‎ . 106: ۰ 16 


باستخدام هذا یمکننا رسم المواليدني أيام الأسبوع لعدة عقود: 


births.pivot_table('births', index='dayofweek,' 
columns='decade', aggfunc='mean') .plot(0 

ره مق "تمي حم" مقن" از XETER Tae LS‏ عاعاج رم BE OCA‏ 

E SSE OUT از‎ 

111 .712061 ) Mean فلع رط‎ OV 02۷7۲ 

plt.showO 


5400 


Day 


Average Births by 
4 


4200 


4000 


Mon Tues Wed Thurs Fri Sat Sun 
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يبدو أن الولادات أقل شيوعًاني عطلات نهاية الأسبوع منهاني أيام الأسبوع! لاحظ أن التسعینیات 
والألفينيات من القرن الماضي مفقودة لأن بيانات مركز السيطرة على الأمراض تحتوي فقط على 


وجهة نظر أخرى مثيرة للاهتمام هي رسم متوسط عدد المواليد حسب اليوم من السنة. دعنا أولاً 
نجمع البيانات حسب الشهر واليوم بشكل منفصل: 


DHE EDS كلت ها = تما‎ Evo ای ( وتا‎ I, 
OEE ERS , 1۳06۶ MORE, ود‎ . 1006: SAVIN) 
BERE )5 1 ERS 0۵۳۲۰620 )(( 


3 EMS MONE. index = Od. datetime )2012, بتك لص‎ ( 
ioe (MORE, Gav) En كلت ده‎ MONE. 10674 | 
DERE (OIE ERS 226 282 22224400 ( 


births 
4009.225 
4247.0 


1 1 

2 

3 4566 . 98 
4 

5 


4571.0 

4603.625 
births 
2012-01-01 4009.25 
2612-61-82 4247 . 48 
2012-01-03 4566 . 068 
2612-61-84 4571.0 
2612-61-85 5 


بالتركيز على الشهر والیوم فقط. لدینا الان سلسلة زمنية تعکس متوسط عدد الموالید حسب 
تاريخ السنة. من هذاء یمکننا استخدام طريقة 0106 لرسم البیانات. یکشف عن بعض الاتجاهات 
المثيرة للاهتمام: 

fig, ax = plt.subplots(figsize= (12, 4)) 


3 فطع‎ _ 1۵ . 9101 (ax=ax) 
1911 . 510170 


و۶4 سس 


MN 
0 ۱۷۷۷۷۸۸ ۷ 7 ۱ 
480 ۸/۸۸ ۸ اس‎ MM M 3" ۱ 
ده‎ ۲ ۱۸/۷۷/۷ Mn ۲ ۳ أ‎ 
4 0C ۱ ۱ 

۱ ۱ 


۱ 400 
2 0 1 ود رز ۱ or‏ نذا 


تحليل المشاعر في تقييمات منتجات 4121220 باستخدام بايثون | 7۸۳ 


۶9 تحليل المشاعر في تقييمات منتجات ۸2200 
باستخدام بایئون Amazon Product Reviews‏ 


Sentiment Analysis with Python 
هى شركة أمريكية متعددة الجنسيات تركز على التجارة الإلكترونية والحوسبة السحابية‎ 0 
والبث الرقمی ومنتجات الذكاء الاصطناعی. لكنها معروفة بشكل أساسى بمنصة التجارة‎ 
الإلكترونية الخاصة بها والتي تعد واحدة من أكبر منصات التسوق عبر الإنترنت اليوم. هناك الكثير‎ 
من العملاء الذين يشترون المنتجات من 1122011 حتى أن 0 تكسب اليومفي المتوسط‎ 
مليون دولارفي اليوم. لذاء فإن وجود مثل هذه القاعدة الكبيرة من العملاء سرع‎ 638.1 
مشروعا رائعًا لعلوم البيانات إذا تمكنا من تحليل مشاعر مراجعات منتجات 4201 ۸. لذلك‎ 
في هذه المقالة. سوف أطلعك على مهمة تحليل آراء مراجعات منتجات ۸2200 باستخدام‎ 


بايثون. 


تحليل المشاعر في تقييمات منتجات ۸220۴ باستخدام بايثون 

تم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل آراء مراجعات منتجات 411122011 من 
ع . تحتوي مجموعة البيانات هذه على مراجعات المنتجات لأكثر من 568000 عميل 
اشتروا منتجات من ۰۸۰۵20 فلنيدأ هذه المهمة عن طريق استيراد مكتبات بايثون ومجموعة 
البيانات الضرورية: 


0 وه 0220295 1۳001۲ 

import 563201213 as 5 

1 وه ۰0۷۵101 1۵101011110 1۳001 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer )( 


0212 = 0.168۵0 697 (ROVI 675 ESM) 
print )02 12 ۰.1620 )( ( 


Id ProductId Userld ProfileName ١ 


A3SGXH7AUHUSGW delmartian‏ 8001840۴69 1 و 
دم 411 A1D87F6ZCVESNK‏ 8008136864 2 1 
ABXLMWJIXXAIN Natalia Corres "Natalia Corres"‏ 866600068 3 2 
Karl‏ 0 309018901 4 3 
AIUQRSCLFSGWIT Michael D. Bigham "M. Wassir"‏ 80061022271 5 4 
HelpfulnessNumerator HelpfulnessDenominator Score Time \‏ 

8 1 3 5 1303862400 
1 3 e 1 0 
2 1 3 4 0 
3 3 3 2 
4 3 e 5 1350777600 

summary Text 
و‎ Good Quality Dog Food I have bought severa 1 of the Vitality canned d... 
1 Not as Advertised Product arrived labeled as Jumbo Salted Peanut... 
2 "Delight" says it all This is a confection that has been around a fe... 
3 Cough Medicine If you are looking for the secret ingredient i... 
4 Great taffy Great taffy at a great price. There was a wid... 
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قبل المضى قدمّاء دعنا نلقى نظرة على بعض المعلومات المطلوبة من مجموعة البيانات هذه: 
print (data.describe )((‏ 


Id HelpfulnessNumerator HelpfulnessDenominator \ 


count 568454 . 0 568454. 0 568454 . 0 

mean 284227 . 6 1.743817 2.1 

std 164098.679298 7.636513 8.28974 

min 1. eeeeee 6 . 666666 9.066 

66666 .6 تست 250000 .142114 25% 

50% 284227 . 500000 6. 060066 1.0 

75% 426346 . 0 20 2.06 

max 568454 . 066668 866 . 0666666 923.00000 
Score Time 

count 568454.000000 5.684540e+05 

mean 4.183199 وهبع1.296257‎ 

std 1.310436 4.804331e+07 

min 1.000000 9.393408e+08 

25% 4.000000 1.271290e+09 

50% 5.686660 1.3111266+9 

75% 5.686660 1.332720e+09 

max 5.000000 1.351210e+09 


نظرًا لآن مجموعة البيانات هذه كبيرة جداء فهي تحتوي على بعض القيم المفقودة ( 1155108 
5 لذا دعنا نزيل جميع الصفوف التي تحتوي على القيم المفقودة: 

(220مه02 . و02 = data‏ 
تحليل المشاعر لمراجعات منتجات ۸022010 
يحتوي عمود النقاط (01111112© 01 5)في مجموعة البيانات هذه على التصنيفات التى منحها 
العملاء للمنتج جا علی تجربتهم مع المنتج. لذلك دعونا نلقي نظرة على تفاصیل التصنیف 
لمعرفة كيف یقوم معظم العملاء بتقییم المنتجات التي یشترونها من Amazon‏ : 


۲211005 = 4208 1] ۳56016۷ [ value واصتاهه‎ )( 
numbers = ratings.index 
quantity = ratings.values 


custom colors = ["skyblue", "yellowgreen", 'tomato'", "blue", 
"red" 1 3 

DLE. ۴1 <ه2 ۶1051) هیال‎ (1O, 8)) 

11 . 16 (Guam EREY, 121 لع وباه‌حوه1هه . , واه طصبادرحو‎ COESES) 
ceneral الا ۵ ان = ع‎ USS Color لطب‎ 22 
اوہ غاا - اد‎ 

ECOSOC ( 2 41 9۳ و۱ باه‎ Gi rele) 

OEE )لوس‎ EOE, 1ه‎ 294-12 

PEE SENE LENE تن ان ره عت وك‎ OE AMAZON ته عه‎ RAEIROS 
fontsize=20) 

1911 . 5۳07 )( 


تحليل المشاعر في تقييمات منتجات 811320 باستخدام بايثون 


Distribution of Amazon Product Ratings 


5 


وفقا للشكل أعلاه» صنف أكثر من نصف الأشخاص المنتجات التي اشتروها من 8112201 ب 
5 نجوم. وهو أمر جيد. الآن. سأضيف ثلاثة أعمدة أخرى إلى مجموعة البيانات هذه على أنها 
موجبة (10516076) وسلبية (622176) ومحايدة (116111521) من خلال حساب درجات 
المشاعر(560165 56126111216116) لمراجعات العملاء المذكورةفي عمود النص (صصتامی 566 1') 
لمجموعة البيانات: 


sentiments = SentimentIntensityAnalyzer )( 


dale all LEO SHE vel SS SORE MEME SPOOL SECOEE SM) |! دهن‎ ۱ 242 
an 4212 ] ۲۲۵۶۲۲ [ 

dE 9 ۱۳۱۱6۵ YON 3> SOME UME O. ار ینعی 517 هلمم‎ EEC N EOE 24 
in data ] ۲۲۵۶۲۳۲ | 

FOS 1‏ | تاک ۲۱ (E)‏ دهد اد و او ماه تسوا < eral ll‏ ۲۰۱6 0212 
an data ] ۲۳۵۶۲۲ [‏ 


print (data.head )(( 


Id ProductId Userld ... Positive Negative Neutral 
@ 1 800186416۴69 A3SGXH7AUHUSGW ... 0.305 6.666 6.655 
1 2 8668136864 ۲ ... 6.066 0.138 0.862 
2 3 86601006۷9 ۰ ABXLMWJIXXAIN ... 0.155 9.091 0.754 
3 4 86660826010 395806606۴60 ... 6.6066 6.666 1.68 
4 5 8006122271 ۵18561۴86۷11۲ ... 0.448 6.666 0.552 


[5 rows x 13 columns] 


دعنا الآن نرى كيف قام معظم الناس بتقييم المنتجات التي اشتروها من أمازون: 


x = sum (data["Positive"]) 
y = sum (data ["Negative"] ) 
2 = sum (data ["Neutral"] ) 


deE م19 002 29 ممه راداوه‎ CE 
31۶ (3 5) QARI (aze): 
print ("Positive @ ") 
611۶ (ححط)‎ EAC (0<ظ)‎ : 
print ("Negative ۷ 
21 
9111 ) ۲۵۱1 9 1۷ 
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sentiment_score (x, ملآ‎ 2( 


Neutral © 


لذلك. يكون معظم الأشخاص محايدين عند إرسال تجاربهم مع المنتجات التي اشتروها من 
2 الآن دعنا نرى إجمالي جميع درجات المشاعر : 
عد رت ۲۸۵ لع دك 8ك ) 1822211015 


19111 ) 225261025 ۳۲, VW) 
DERE UNeUEEAL 2 رت‎ 2 


Positive: 193287, 2 
Negative: 3 4 
Neutral: 42 6 


لذلك یمکننا القول إن معظم المراجعات للمنتجات المتاحة على ۸2200 إيجابية. حیث أن 
إجمالي درجات المشاعر الايجابية والمحايدة آعلی بکثیر من النتائج السلبية. 


الملخص 

إذن هذه هي الطريقة التي یمکننا بها تحلیل مشاعر مراجعات المنتجفي ۰۸220 هناك الكثير 
من العملاء الذین پشترون المنتجات من ۸۰2200 حتی أن 11122012 تکسب الیومفي المتوسط 
1 ملیون دولارفي الیوم. لذا. فان وجود مثل هذه القاعدة الكبيرة من العملای سیصبح 
مشروعا رائعًا لعلوم البیانات إذا تمکنا من تحلیل مشاعر مراجعات منتجات ۰۸22207 آمل أن 
تکون قد أحببت هذه المقالة حول تحلیل المشاعر لمراجعات 81222012 باستخدام بایشون. 
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0 تحليل مشاعر تقييمات الفندق مع بايثون ۲10061 
Reviews Sentiment Analysis with Python‏ 


عندما نبحث عن فنادق لقضاء الاجازة أو السفی نفضل دائمًا فندقًا معروفا بخدماته. أفضل 
طريقة لمعرفة ما إذاكان الفندق مناسبًا لك أم لا هي معرفة ما يقوله الناس عن الفندق الذي أقام 
هناك من قبل. من الصعب للغاية الآن قراءة تجربة کل شخص أبدى رأيهفي خدمات الفندق. هذا 
هو المكان الذي تأتي فيه مهمة تحليل المشاعر (211217515 عصعحصتاصعه) .نی هذه المقالة سوف 
أطلعك على مهمة تحليل مشاعر تقييمات الفندق ( Hotel Reviews Sentiment‏ 
)A "2‰‏ باستخدام بايثون. 


تحليل مشاعر تقييمات الفندق مع بايثون 

يتم جمع مجموعة البيانات التي أستخدمها لمهمة تحليل آراء الفنادق من 1[ع128. يحتوي على 
بيانات حول 20000 تقييم للأشخاص حول خدمات الفنادق التي أقاموا فيها لقضاء عطلة أو 
رحلة عمل أو أي نوع من الرحلات. تحتوي مجموعة البيانات هذه على عمودين فقط كمراجعات 
)R e view 5(‏ وتقييمات (122]025) للعملاء. لذا فلنبداً بمهمة تحليل آراء الفنادق باستخدام 
بايثون من خلال استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


1۳001۲ pandas وه‎ 0 

import 56320123 as 5 

1 وه ۰0۷۵101 1۵101011110 1۳001 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 


data > 0.1620 697 ) MOEN 6171617۷5 ۰ CSM) 
911 )0212 head )( ( 


Review Rating 
nice hotel expensive parking got good deal sta... 4 
ok nothing special charge diamond member hilto... 
nice rooms not 4* experience hotel monaco seat... 


unique, great stay, wonderful time hotel monac... 


BwN HH © 
n ذم نا ص‎ 


great stay great stay, went seahawk game ۰ 


مجموعة البيانات هذه كبيرة جدا ولحسن الحظ لا توجد قيم مفقودة لذا دون إضاعة أي وقت. 
دعنا نلقي نظرة سريعة على توزيع تقييمات العملاء: 


ratings 022 ] Rat الس‎ | ۰۷72116 6010۳۲5 )( 
numbers ratings.index 
quantity = ratings.values 


م 2 ,۲۲۵۳۵0۲ ,۲۷۵110۳01661۳۲ ,۲۲5116۲ < 561286525 CUSEOM‏ 
ا 1 دنه تا 
((5 57 حه2 051 ۶1) 210025 . 111 
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11 , 16 ) 4092822 EY, 1201 5 206 كت لت‎ COLOES<CUSEOM COOLS) 
CERNE EAN ههام لور > عته‌عیادی‎ ) (O, OJ, 057 Colo ل‎ 
)ا عه 1۵ ا‎ 

1E OEE J «OE ACES (CEEOL رك لالع هه‎ 

EON, Size 2)‏ !)لوط تا هر 

plt.title ("Hotel Reviews Ratings", fontsize=20) 
1011 . 5۳017 )( 


Hotel Reviews Ratings 


5 


يمكن ملاحظة أن معظم النزلاء قيموا الخدمات الفندقية ب 5 نجوم و4 نجوم. لذلك وفقا 
للتصنيفات المذكورة أعلاه. یمکننا القول إن معظم الضيوف راضون عن خدمات الفندق الذي 
أقاموا فيه. دعنا الآن نمضي قدمّا من خلال تحليل مشاعر تقييمات الفنادق. لتحليل وجهة نظر 
تقييمات الفندق. سأضيف ثلاثة أعمدة إضافية إلى مجموعة البيانات هذه على آنها إيجابية 
)Positive(‏ وسلبية )Negt1ve(‏ ومحايدة ([116112) من خلال حساب درجات المشاعر 


رمع )sentiment‏ للتقييمات: 


sentiments = SentimentIntensityAnalyzer )( 


dale all LEOS HE vel SS SORE MEME SPOOL EY SCO ES) Bos Eo اد‎ 
in 0212 ] ۲۹۵۲1۲۷۳۲ [ | 

09 هت ۱۳۱۱6۵9 9 تا‎ | = SEE UME ME ار هنت مار‎ EREN EOE 4 
in data ] ۲۹۵۲1۲۷۳۲ [ [ 

1 کته | (E) neu‏ هدهع او و ما و۱ Neu eral ll‏ 038210 


۱ 
) 


in data ["Review"] 
print (data.head )( 

Review Rating Positive Positive Negative Neutral 
nice hotel expensive parking got good deal sta... 4 0255 025 0.072 0.643 


ok nothing special charge diamond member hilto... 2 0.189 09 0.2110 0.701 
nice rooms not 4* experience hotel monaco seat... 3 09 0.219 601 0.700 
unique, great stay, wonderful time hotel ۰ 5 0.385 0.385 6.66 0555 
great stay great stay, went 56۵۳81 game ۰ 5 01 0.221 0.135 0.643 


وفقا للتقييمات (6716775): يبدو أن ضيوف الفندق راضون عن الخدمات. فلنلق الآن نظرة 
على رأي معظم الناس‌في خدمات الفنادق بناءً على مشاعر تقييمهم: 


x = sum (data["Positive"]) 


تحليل مشاعر تقييمات الفندق مع بايثون 219 


sum (data ["Negative"]) 
كله‎ )0212 ] LNeUEEaALLI) 


def Sentiment ریا جهدولهای‎ O, زم‎ 
1 ۶ (طحة)‎ 2 )2<60( : 
19111 ) ۲۳۵ ۵ 5 
11۶ )<2( 2114 GOC: 
print ("Negative "( 
else: 
PERRER [2 لك 2 6ن‎ ۵ ۷ 
56۳1۲1۳0611] SEO, ۷ 2 


Neutral © 


وبالتالي» يشعر معظم الناس بالحياد ([2611652) تجاه خدمات الفندق. الآن دعنا نلقي نظرة 
فاحصة على نتائج المشاعر: 
د مت OEE LESSEE‏ 


9111 ) :ك2 62ت نع‎ ۳۲, Vv) 
DEME زه ری ع ك221)‎ 


Positive: 2 
Negative: 173 8 
Neutral: 12657 37 


وبالتالي وفقاً للنتائج المذكورة أعلاه» تم تصنیف آکثر من 12000 مراجعة على آنها محايدة 


وتم تصنیف آکثر من 6000 مراجعة على آنها ايجابية. لذلك یمکن القول إن الناس سعداء حقا 
بخدمات الفنادق التی آقاموا فیها حیث أن التقییمات السلبية أقل من 1500. 


الملخص 

هذه هي الطريقة التي يمكنك بها تحلیل مشاعر تقییمات الفنادق. أفضل طريقة لمعرفة ما لذا کان 
الفندق مناما لك أم لا هي معرفة ما یقوله الناس عن الفندق الذي آقام هناك من قبل. هذا هو 
المكان الذي يمكن أن تساعدك فيه مهمة تحليل مشاعر تقييمات الفندق على تحديد ما إذا كان 
الفندق مناسبًا لرحلتك أم لا. آمل أن تكون قد أحببت هذه المقالة حول تحليل المشاعر لتقييمات 
الفنادق باستخدام بايثون. 


تحليل المشاعر في متجر :512 600816 باستخدام بايثون 


1 تحليل المشاعر في متجر 28139 عاع00 باستخدام 
بايثون Google Play Store Sentiment Analysis using‏ 
Python‏ 


تحليل المشاعر (3112177515 56176113611) هو تصنيف لمراجعات العميل أو تعليقاته على أنها 
إيجابية (positive)‏ وسلبية (negative)‏ وأحيانًا محايدة ([2تاعم) آیضا. تحلل معظم 
الأنشطة التجارية مشاعر عملائها حول منتجاتهم أو خدماتهم لمعرفة ما يريده عملاؤهم منهم. 
يحتوي متجر 012۲ ©0081 على ملايين التطبيقات مع مراجعاتها. لذا ستكون حالة استخدام 
جيدة لتحليل المشاعر لتحليل مشاعر التطبيقات المتاحة على متجر 0127 16ع6008. لذلك.ني 
هذه المقالة» سوف أطلعك على مهمة تحليل المشاعرني متجر ۳1۵ 16ع7008) باستخدام بايثون. 


تحليل المشاعر في متجر 21237 6200216 

يمكن العثور على متجر وها 16[ع00 على جميع الهواتف الذكية والأجهزة اللوحية التي تعمل 
بنظام ۰۸0۲010 هذا هو متجر تطبيقات 0016) الرسمي لنظام التشغيل ۰۸۵0۲010 يحتوي 
على ملايين التطبيقات مع مراجعاتها حتى نتمكن من استخدام مثل هذا القدر من البيانات لأي 
مهمة تتعلق بعلوم البيانات. تحليل آراء العملاء وتعليقاتهم هو ما نقوم بهفي مهمة تحليل المشاعر. 
بعد قولي هذاءفي القسم أدناه» سوف أطلعك على مهمة تحليل المشاعرفي متجر 21377 0008216 
باستخدام بايثون. يمكن تنزيل مجموعة البيانات التي آستخدمهاني هذه المهمة من هنا. 


تحليل المشاعر في متجر 21237 20016 باستخدام بايثون 
سأبدأ هذه المهمة بقراءة مجموعة البيانات. يتم تنزيل مجموعة البيانات التي أستخدمها هنا من 
ماع عه والتي تم جمعها من متجر 2137 16ع600. فلنبداً هذه المهمة بقراءة مجموعة البيانات: 


۶101 222220615 MOOSE COUR E 

EEOM RIES UE LE MOOSE OIE 

1۳001۲ pandas aS 0 

03283 > 0.1620 CSU ( USE 6۷716175 ۰.057۷ ( 
print (data.head() ( 


App ... Sentiment_Subjectivity 
6 16 Best Foods for You ... 0.533333 
1 16 Best Foods for You ... 0.288462 
2 16 Best Foods for You ... NaN 
3 16 Best Foods for You ... 6. 575066 
4 16 Best Foods for You ... 6. 3000080 


قبل المضي قدمًاء دعنا نلقي نظرة على ما إذا كانت مجموعة البيانات هذه تحتوي على أي قيم 
مفقودة أم لا: 
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( () ناو . () 15۳1011 .12 02) 16 911 


App 6 
Translated_Review 26868 
Sentiment 26863 
Sentiment_Polarity 26863 


Sentiment_Subjectivity 26863 
dtype: int64 


إذاً تحتوي على بعض القيم الفارغة. سأقوم بإنشاء مجموعة بيانات جديدة بإسقاط القيم الخالية: 


data = data.dropna() 
ضرم‎ E (GANE aE 15۳1011 )( . تاو‎ )( ( 


App 
Translated_Review 


6 
e 
Sentiment 6 
Sentiment_Polarity 6 
6 


Sentiment_Subjectivity 
dtype: int64 

الآن لتحليل المشاعر الخاصة بمراجعات متجر 127 16ع00ع » سأضيف ثلاثة أعمدة جديدةفي 
مجموعة البيانات من خلال فهم مشاعر كل مراجعة للعميل على أنها إيجابية وسلبية ومحايدة: 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer )( 


dJaleall LEO SE ve 2 SORE MEME SPOOL AEE SCOEE SE عم و‎ EOE هك‎ 
im data ] ۲۲۴۵۴916660 Review! | | 

68:53 ] ۲۱۲۵9231576۳ [ = SSC MEME Oo 012711۷7 50069 )1( ] ۲۴۵9۳۲ [ EOC 1 
1 ظ‎ CEE ] ۲۲۴۵۴۸912160 ۳5۵۲7161۷۳ [ [ 

1 2652 | تاک ۱ (E)‏ 225 مت 5 ما عدت و 1202215 ایو [" لت ۱۱ 29 
in 0218 ] ۲۲۴۵۴916660 Revi eW |‏ 


print (data.head() ( 


App Translated_Review ... Negative Neutral 
6 16 Best Foods for You 1 like eat delicious food. That's I'm cooking ... ... 6.6 6.466 
3 10 Best Foods for You Works great especially going grocery store 6.6 6.549 
4 16 Best Foods for You Best idea us ... 6.6 0.323 
5 16 Best Foods for You Best way 6.6 22 


والان كخطوة آخیرق دعنا نلقي نظرة على مشاعر العملاء حول التطبيقات المتاحةفي متجر 
Google play‏ باستخدام مخطط مبعثر (املح 1ع]5026): 


ات AS‏ ان ی مات هرن ری ها ان ۱۱۳۵ 

import 563201223 as 5 

1911 . ۴1 حه2 ۶1051) هیال‎ )15 , LO) 

SNS . 08۵] لت ۲56۳۴11۳0616 ] 212) 0 لام ضع‎ EY lU, 

م1 او _ اطمط1] ۲۱569 ] 8262 

hue = data['Sentiment'], edgecolor='white'", 
31611۲62۳0۷74111 01] 5۳1۶160 E) 

plt.title ("Google Play Store Reviews Sentiment Analysis", 
fontsize=20) 
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222 تحليل المشاعر في متجر ۳۱۵۲ 600816 باستخدام بايثون 


Google Play Store Reviews Sentiment Analysis 


101 ۶ 
2 
۰ 
083 ¢ 
۳ 0 
ع‎ ۰ 
1 
,ك‎ 6 
2 
E) 
ا‎ 
5041 هه‎ 
3 
چ‎ 
3 0 sentiment > £ 6 
© Positive ۳ ۰ 
Neutral 
0.0 | ® Negative ۰.۰ 
-1.00 5 -0.50 -0.25 0.00 0.25 0.50 0.75 1.00 


Sentiment_Polarity 


إذن هذه هي الطريقة التي يمكننا بها تحليل مشاعر مراجعات متجر ام 200810 تحليل 
المشاعر هو تصنيف لمراجعات العميل أو تعليقاته على أنها إيجابية وسلبية ومحايدة. أتمنى أن 
تكون قد أحببت هذه المقالة حول مهمة تحليل مشاعر متجر 1337 000816 باستخدام بايثون. 


تحليل مشاعر مراجعات 416:2 411122011 باستخدام بایئون 


2 تحليل مشاعر مراجعات :»416 ۸۰2۶20 باستخدام 
بايثون Amazon Alexa Reviews Sentiment Analysis‏ 
using Python‏ 


۸1۵2 ۸2200 هي خدمة صوتية مستندة إلى السحابة تم تطويرها بواسطة ۸۵20 تتبح 
للعملاء التفاعل مع التكنولوجيا. يوجد حاليًا أكثر من 40 مليون مستخدم ل ۸1۵ حول العالی 
لذا فإن تحليل مشاعر المستخدمين حول ۸162۸ سيكون مشروعًا جیدا لعلم البيانات. لذاء إذا 
كنت تريد معرفة كيفية تحليل مشاعر المستخدمين باستخدام ۸162 ۸2200 فهذه المقالة 
مناسبة لك.في هذه المقالة. سأوجهك خلال مهمة تحليل آراء Amazon Alexa‏ باستخدام 


بايثون. 


تحليل مشاعر مراجعات 81652 ۸۵220 باستخدام بايثون 

تم جمع مجموعة البیانات التي آستخدمها لمهمة تحليل المشاعر لمراجعات ۸6۵ ۸2209 
من 1622816 يحتوي على بیانات حول التصنیفات بين 1 و 5 » وتاریخ المراجعات » وتعلیقات 
العملاء حول تجربتهم مع a×ء[۸.‏ لذلك دعونا نستورد مجموعة بیانات ومکتبات بایثون 
الضرورية التي نحتاجها لهذه المهمة: 


1۳0011۲ Pandas وه‎ 0 

import seaborn as 5 

1 وه 1۵101011110۰۳۷۵1 1۳001 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer )( 


data = 

pd.read csv ("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/amazon alexa.tsv", delimiter='\t') 

print (data.head() ( 


rating date variation verified_reviews feedback 
8 5 31-Jul-18 Charcoal Fabric Love my Echo! 1 
1 5 31-Jul-18 Charcoal Fabric Loved it! 3 
2 4 31-Jul-18 Walnut Finish Sometimes while playing a game, you can answer... 1 
3 5 31-Jul-18 Charcoal Fabric I have had a lot of fun with this thing. My 4 ... 1 
4 5 31-Jul-18 Charcoal Fabric Music 1 


لنبدأ بإلقاء نظرة على بعض المعلومات الموجودةني تلك البيانات لمعرفة ما إذا كنا بحاجة إلى 
print (data.describe )( )‏ 


9110 )02 12 . 15۳1011 )( SUMO) 
DE ARE )02 122 . CO LUMA S) 
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rating feedback 
count 3150.000000 3156.0 
mean 4.4645 0.918413 
std 1.068506 0.273778 
min 1 0 6 . 0660686 
25% 4.89 110 
50% 5 .eeeeee 1.0 
75% 5 . 6 1.6666 
max 5 .eeeeee 1.0 
rating 8 
date 8 
variation 8 
verified_reviews 8 
feedback 8 


dtype: 21064 


Index(['rating', 'date', ‘variation', 'verified_reviews', 'feedback'], dtype='object') 
يحتوي عمود تصنيف مجموعة البيانات (0111712© 726128 02635665) على التقييمات التي‎ 
قدمها مستخدمو ۸1۵ 417122011 بمقياس من 1 إلى ۰5 حيث يمثل الرقم 5 أفضل تقييم‎ 
يمكن للمستخدم تقديمه. لذلك دعونا نلقي نظرة على توزيع التقييمات التي منحها مستخدمو‎ 


:Amazon Alexa 


۴8۲1009 > 4262 ] ۲۴21۳00۳" [ ۰72116 60۱5 )( 
numbers = ratings.index 
quantity = ratings.values 


CUSEOM 501525 < ۲۳۲51116۲, ۳۲۷۵11000166۳1۳۲, ۲۲۵۳۵0۲, "5112 م‎ 
"red" 1 0 

))5 , 5) حه2 051 ۶1) هیال ۴1 . 1911 

11 , 16 1اصهتا)‎ EY, 121 ها وباه‌حوه1هه . , واه طصبادرحو‎ _60109( 
CEME EAN کت‎ > le Ci را حلت‎ O, Colo < EY) 

E e )(‏ - قلط 

1E EE ( sO 9۳ ره و۵۱9 باه‎ 

111 . EEN LEONEL, 5126-21 2( 

plt.title ("Amazon Alexa Reviews", fontsize=20) 
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Amazon Alexa Reviews 


تحليل مشاعر مراجعات ۸۱6۵ 4112701 باستخدام بايثون 


220 


من الشکل آعلاه. یمکننا أن نوق أن معظم العملاء قد صنفوا ۸۱6562 11122011 بمافي ذلك جمیع 
متغیراتها على آنها 5 لذا فهذا یعنی آن معظم العملاء سعداء بخدمة ه412 Amazon‏ . 


تحلیل مشاعر مراجعات ۸16۶2 ۸۵22010 
الآن دعنا ننتقل إلى مهمة تحلیل المشاعر لمراجعات ۰۸1۵2 يحتوي عمود المراجعات التي تم 
التحقق منها (محصنامی (verified reviews‏ مجموعة البیانات على جمیع المراجعات التي 
قدمها عملاء 41622 ه8132 . لذلك دعونا نضيف أعمدة جديدة إلى هذه البيانات على أنها 
أعمدة إيجابية (ع20517) وسلبية (ع2617ع116) ومحايدة (81611531) من خلال حساب 
درجات المشاعر للمراجعات (5ع5001 :(sentiment‏ 


sentiments = SentimentIntensityAnalyzer )( 


> دا 6۳۱6و‎ Polar EY ممه رد ) وه‎ FO 
> N SCREIMeME SH OOLAE TEY اون و۱ رن من ری‎ OE 


< ی از را فت سمت 5 را خن یلوزن هیا‎ EO 


Neutral 
0.308 
0.193 
0.784 
0.617 
1.68 


. Positive Negative 


6.66 
6.66 
222 
6.66 
6.666 


202 
67 
224 
0.383 
6.666 


data ] "205117" [ 


CECE ] ۲۷۵1 ۶160 ۳6۷16175 ۲ [ [‏ ظ1 


0212 ] ۲۱۲۱۵0211776۳ [ 


in data ] veri ۶160 mey ewS ۲ [ | 


data ["Neutral"] 


1 ظ‎ 0۵12 ] ۲۷۵1۶160 ۳6۷16175 ۲ [ [ 
print (data.head () ) 


Fabric 
Fabric 
Finish 
Fabric 


Fabric 


variation 


Charcoal 
Charcoal 

Walnut 
Charcoal 


Charcoal 


date 
31-Ju1-18 
31-Ju1-18 
31-Ju1-18 
31-Ju1-18 
31-Ju1-18 


rating 


5 


© در یه س د 
ما >« n n‏ 


دعنا الآن نلخص درجات المشاعر لكل عمود لفهم ما يعتقده معظم عملاء Amazon Alexa‏ 


3 


بشانه: 


x = sum (data["Positive"]) 
y = sum (data ["Negative"] ) 
z = sum (data ["Neutral"] ) 


E 566148 (ê, مها‎ CJS 
)3<60( 2 


and 


911 1 ) ١ 86 1ك‎ ۵ @ 9 


EC: 


and 


(b>a) 


print ("Negative ۳ 


911 1 ) ۲۵۱1 9 "0 


EZ) 


def sentimen 
1 ۶ (2©) 


11 
else: 


56۳۲110611 502 (x, 


Neutral 7 
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وبالتالي» فإن الناتج النهائي الذي نحصل عليه يكون محایدا. هذا يعني أن معظم المستخدمين 
يشعرون بالحياد تجاه خدمات ۸12 :۰۸۱۵20 دعنا الآن نرى مجموع درجات المشاعر لكل 
عمود: 
عد مت LESSEE‏ ع شم 
Negative: 7 Vv)‏ 19111 
)7 3 2ط ع ك21 ) DERE‏ 
Positive: 1035.4579999999983‏ 


Negative: 96.79999999999995 
Neutral: 1936.740999999996 


لذلك يمكننا أن نرى أن الايجابي والمحايد أعلى من 1000 حيث يكون السلبي أقل من 100. 
وهذا يعني أن معظم عملاء ۸162 81132011 راضون عن خدماتها. 

الملخص 

هذه هي الطريقة التي يمكننا بها تحليل مشاعر مراجعات ۸162 4112122012 باستخدام لغة برمجة 
بايثون. يوجد حالیّا أكثر من 40 مليون مستخدم ل 8162 حول العالم لذا فإن تحليل مشاعر 
المستخدمين حول ۸۱6262 سيكون مشروعًا جيد لعلوم البيانات. أتمنى أن تكون قد أحببت هذه 
المقالة حول مهمة تحليل اراء ۸162 1122011 باستخدام بايثون. 


نظام توصية 41212202 باستخدام بايثون 227 


3) نظام توصية ۸2۶08 باستخدام بايئون ۸۵220۲ 


Recommendation System using Python 
تعد أنظمة التوصيات (ك1ءاءyر؟ 02102 ع م<ةحددهء»ء 12) أحد التطبيقات المستخدمة على‎ 
نطاق واسع لعلوم البيانات‌في معظم الشركات استنادًا إلى المنتجات والخدمات عبر الانترنت.‎ 
مثال رائع لهذه الشركات. كونك موقعا للتسوق عبر الانترنت. تحتاج ۸۰۵20 إلى‎ 7 
إنشاء توصيات مخصصة لتوفير تجربة مستخدم آفضل.في هذه المقالة. سوف أطلعك على كيفية‎ 

إنشاء نظام توصية ۸222010 باستخدام بايثون. 


نظام توصية ۸۲22010 

يتبع نظام التوصياتفي Amazon‏ مبداً إنشاء توصيات قائمة على المنتج ( product based‏ 
5135 مما يعني قياس أوجه التشابه بين منتجين ثم التوصية بالمنتجات الأكثر 
تشابهًا لكل مستخدم. لطالما كانت طرق قياس أوجه التشابه بين منتجين محل تركيز رئيسي 
للباحثين. 


ولكن عندما يتعلق الأمر بموقع مثل ۸0۵20۳ فإنه يحتاج إلى إضافة المزيد من المعايير 
للتوصية بالمنتجات للمستخدمين مثل جودة المنتج. سيكون للمنتج الجيد دائمًا مجموعة جيدة 
من المراجعات حتى نتمكن من استخدام كل من نقاط التشابه ومراجعات المنتج لإنشاء 
توصيات.في القسم آدناه. سوف أطلعك على كيفية إنشاء نظام توصيات آمازون باستخدام بايثون. 


نظام توصية ۸220۴ باستخدام بايثون 

سأحاول استخدام عدد أقل من مكتبات بايثون التي يمكنني استخدامها لإنشاء نظام التوصية هذا. 
للعمل مع البیانات. سأستخدم مكتبة 222025 و :۳ فقطفي بايثون. فلنستورد البيانات 
ونرى كيفية إنشاء نظام توصيات ۸۰۵20 باستخدام بايثون: 


311۳00 7ه‎ aS MP 
111250526 pandas وه‎ 0 


Jat a 5 0۰1620 69 )۲ 21820۳8 IES) 
print (data.head() ( 


AKM1MP6POOYPR 0132793040 5.0 0 
6 ۸20071110۳782106 0321732944 5.0 1341100800 
1 A2NWSAGRHCPSNS5 0439886341 ۰ 60 
2 A2WNBOD3WNDNKT 0439886341 3.0 60 
3 ۸16161425832۸8 0439886341 1.0 1334707200 
4 A1QGNMC6O1VW39 0511189877 5.0 0 


228 علم البيانات: عن طريق الامثلة 


لا تحتوي مجموعة البيانات التى أستخدمها هنا على أسماء أَعمدة, لذا دعنا نعطی الأسماء الأكثر 
ملاءمة لهذه الأعمدة: 
ANO |‏ كا , واه رت او ممق تحت ۱ > daca. eo lunns‏ 


مجموعة البيانات هذه كبيرة جدا لذا سأختار عينة: 


df = data ] (3غ2)03ه1)غ15:‎ * .1([ 


() واصناهمی value‏ 10۲ هو ۲ ]0۶ > وعاصتاهه 

| عدت SU)‏ جح هی هروه متیر | dE USO MOAN‏ غلك > dala‏ 

هم 25 ) ۵5 721 01و . () 620 . [ ۲ ۲۴۵۲1۳005 ] ( 310۲ ۲۵10026۲ ) «طامتاه و . 02166 
(56 01۳92۳21 

۶1821 ۳2۳61095 = 0252.01 1701 )1006 = ر 101 وتا‎ COLUMNS 

9۳0 0 ات‎ A تلدع ره اه > ت وی‎ O) 

Run Of ۵11۳05 = MO. COUNE 082670 )۶1821 AES) 


metin GS = inal acing s Shame Ol‏ و "حون جر 
[1] 06و , ۳261005 ۶1821 


density = (num of_ratings/possible_ratings) 
density *= 100 
۶18841 ۳261۳95 ۲ < ۶181 13۲1۳95 ۰120۸90056 )( 


USE 1 ۶‏ ۰209 (10۲1 ۲۵۲000۲6۲ ) #طزنا۲0و data:‏ < 0101060 
الك ۱ اه 5ه ۲۱۰۳ ۲ ۳۳۵۱۵ 


1۳۵19۹۵۳ , ۵۵و ۰ ۱0۰ ه 9 ) < فالتا ۵ ) 6196 .نان 01 
و ات۵ ۱۱۵۵۵ ومت 9 انهوی توت > data‏ تس كه عدن 
ascending = ]0,1[(‏ 

21210180 022 ] Kank | > 

بات دع 16۵1100۲ , 500 2906001) 2201 . [ Seore‏ ] 0212 21210180 

() ۰1620 0212 وله > ۲6601۳8888021108 


سأكتب الان دالة بایشون لانشاء توصیات بناء على درجة (۵»070) تقییمات المنتج: 


def recommend (id) : 


Eecommend 0۴00۲ و6۲‎ > recommenda Ei 05 

۵ < ات9 USES‏ كعات تت كر 016۳۵ ۳ 

COLUMN > tecoMmMmend 00669 . COLUMNS. ۲0115 )(‏ 
او ]لمش لهم 32 | ما موی = COLUMN‏ 

1۴60601۳۳88۳۴0 010 ده _ مومع عظ > وتاهتال‎ 006 ES [EOL UMN 


EecoOMMeRd 100615‏ تا اه 


print (recommend (11) ) 


user_id product_id score Rank 


113 11 2 6 9 
1099 11 21 sS 20 
368 11 605۸2 4 3.0 
612 11 2 69 4 4.8 


5.6 


5 


976 11 1 


نظام توصية 4122202 باستخدام بايثون 229 


الملخص 

هذه هي الطريقة التي یمکننا بها إنشاء نظام التوصية من ۸۵20 باستخدام بايثون. لا تحتوي 
مجموعة البيانات هذه على أسماء منتجات بداخلهاء بل تحتوي فقط على معرّف المنتج لذا 
تصبح نتيجة مراجعات المنتج أهم ميزة لمثل هذه الأنواع من مجموعات البيانات. أتمنى أن 
تعجبك هذه المقالة حول كيفية إنشاء نظام توصية 811322011 باستخدام بايثون. 
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